Facebook ve Instagram’ın çatı şirketi Meta, yeni üretken yapay zeka modelini duyurdu.
Voicebox, özel olarak eğitilmediği halde ses düzenleme, örnekleme ve tarz oluşturma üzere konuşma oluşturma vazifelerini yerine getirme hüneriyle içerik oluşturuculara yardımcı olmak için tasarlandı.
Bu, sadece iki saniyelik konuşmadan gerçekçi bir ses oluşturmak için kullanılabilir, örneğin, potansiyel olarak konuşamayan insanlara ses getirmek yahut insanların seslerini oyunlara eklemek için kullanılabilir.
Meta, tıpkı lisanı konuşmasalar bile insanların birbirleriyle otantik bir biçimde konuşmalarına müsaade vererek, bir konuşma pasajını bir lisandan başkasına tarzı koruyacak formda çevirmek için de kullanılabileceğini söyledi.
Şirket, duyurusunda Voicebox’ın rakiplerinden çok daha tesirli olduğunu argüman etti.
Örneğin, rakip Vall-E’nin yüzde 5,9’una kıyasla yüzde 1,9 yanılgı oranıyla sözcükler üretebiliyor ve bunu 20 kata kadar daha süratli yapıyor.
Meta, Voicebox’ın İngilizce, Fransızca, İspanyolca, Almanca, Lehçe ve Portekizce lisanlarında halka açık sesli kitaplardan gelen 50 bin saatlik konuşma ve transkriptlerle eğitildiğini söyledi.
Ancak Meta, modeli piyasaya sürmeyecek kadar büyük riskler olduğunu söyledi.
Hangi istikametlerden risk barındırabileceği açık halde lisana getirilmese de “Diğer güçlü yeni yapay zeka yeniliklerinde olduğu üzere, bu teknolojinin berbata kullanım ve istenmeyen ziyan potansiyeli getirdiğinin farkındayız” denildi.
Çok sayıda rapor, bu sistemlerin haberlerde uydurma görüntüler oluşturmak, dolandırıcılık davetlerinde insanların seslerini taklit etmek üzere risklerine atıfta bulunuyor.