Metas Voicebox is Stable Diffusion for speech


Meta’nın Ses Kutusu, sesler için Kararlı Yayılma gibidir: Üretken AI modeli, konuşmayı metinden sentezler ve çeşitli konuşma görevleri için kullanılabilir. Voicebox, gerçekçi ve etkileyici sesler üretir ve ses dosyalarından ton, stil veya aksan gibi niteliklerin benimsenmesine izin verir.

Meta’ya göre Voicebox, konuşma kalitesi ve doğallık açısından Microsoft’un VALL-E’si gibi mevcut konuşma sentezi modellerinden daha iyi performans gösteriyor. Meta, “Görev genellemesini başarıyla gerçekleştiren ilk çok yönlü, verimli model olarak, Voicebox’ın konuşma için yeni bir üretken yapay zeka çağını başlatabileceğine inanıyoruz.” dedi. Ekip, kötüye kullanım riski nedeniyle, sentezlenmiş konuşmayı tanımak için bir sistem de geliştirdi ve şimdilik Voicebox’ı piyasaya sürmeyi planlamıyor.

Video: Meta

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top