Meta’s new open source models speak more than 1,100 languages



özet
Özet

Massively Multilingual Speech projesinin bir parçası olarak Meta, 1.100 dilde konuşulan dili metne ve metni konuşmaya dönüştürebilen yapay zeka modellerini piyasaya sürüyor.

Yeni model seti, Meta’nın wav2vec’inin yanı sıra 1.100 dil için derlenmiş bir örnek veri setine ve henüz konuşma teknolojisinin bulunmadığı birkaç yüz kişi tarafından konuşulan diller de dahil olmak üzere yaklaşık 4.000 dil için başka bir derlenmemiş veri setine dayanıyor. Meta.

Model kendini 1.000’den fazla dilde ifade edebilir ve 4.000’den fazla dili tanımlayabilir. Meta’ya göre MMS, on kat daha fazla dili kapsayarak önceki modellerden daha iyi performans gösteriyor. alabilirsin mevcut tüm dillere genel bakış burada.

Yeni Ahit, yapay zeka veri kümesi olarak yeni bir kullanıma kavuşuyor

MMS’in önemli bir bileşeni İncil, özellikle de Yeni Ahit’tir. Meta veri seti, ortalama uzunluğu 32 saat olan 1.107’den fazla dilde Yeni Ahit okumaları içerir.

reklam

Meta, bu kayıtları internetten eşleşen pasajlarla birlikte kullandı. Ayrıca, Yeni Ahit okumaları da dahil olmak üzere, ek dil bilgisi içermeyen 3.809 etiketlenmemiş ses dosyası daha kullanıldı.

Güvenilir bir konuşma tanıma sistemi için dil başına 32 saat yeterli eğitim materyali olmadığından Meta, dalga2vec 2.0 1.400’den fazla dilde 500.000 saatten fazla konuşma içeren MMS modellerini önceden eğitmek için. Bu modeller daha sonra çok sayıda dili anlamak veya tanımlamak için ince ayar yapıldı.

Kıyaslamalar, çok daha farklı dillerle eğitime rağmen modelin performansının neredeyse sabit kaldığını gösteriyor. Aslında, artan eğitimle hata oranı en az yüzde 0,4 oranında azaldı.

Resim: Meta

Meta’ya göre, kapsamlı çok dillilik için açıkça optimize edilmemiş OpenAI’nin Whisper’ından da önemli ölçüde daha düşük. Yalnızca İngilizce bir karşılaştırma daha ilginç olurdu. Twitter’daki ilk test kullanıcıları, Whisper’ın burada daha iyi performans gösterdiğini bildirdi.

Meta’ya göre veri setindeki seslerin ağırlıklı olarak erkek olması, kadın seslerinin anlaşılmasını veya üretilmesini olumsuz etkilemiyor.

Öneri

Github’da açık kaynaklı Modeller.



Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top