Resemble AI, gelişmiş ses üretim modeli DramaBox'u Hugging Face üzerinde açık kaynak yaptı ve bu, yapay zeka ses teknolojisinde önemli bir ilerlemeyi işaret ediyor. DramaBox, yönetmen düzeyinde kontrol için tasarlanmış ilk ses motorudur ve kullanıcılara diyalogların yanı sıra iç çekme veya fısıltı gibi sahne yönlendirmeleri girmelerine olanak tanır. Bu, yapay zeka tarafından üretilen sesleri robotik çıktılardan duygusal açıdan zengin performanslara dönüştürerek insan seslendirme sanatçılarına veya kapsamlı post-prodüksiyona olan ihtiyacı ortadan kaldırır.
DramaBox, hedef sesi taklit etmek için yalnızca 10 saniyelik referans sesi gerektiren sıfır atış ses klonlama özelliğine sahiptir. Ayrıca, kullanıcıların doğal dil komutlarıyla bir karakterin yaşını, aksanını ve duygusunu ayarlamasına izin verir ve stüdyo kalitesinde 48kHz stereo ses üretir. Kötüye kullanımı önlemek için tüm seslerde sıkıştırma ve düzenlemeye dayanıklı görünmez bir filigran bulunur. Model, Lightricks’in LTX-2.3 ses temeli üzerine inşa edilmiştir ve metin işleme için Diffusion Transformer ve Gemma 3 12B gibi gelişmiş teknolojileri entegre eder.
Resemble AI, Duygusal Derinliğe Sahip Açık Kaynaklı Ses Modeli DramaBox'ı Yayınladı
Sorumluluk Reddi: Phemex Haberler'de sunulan içerik yalnızca bilgilendirme amaçlıdır. Üçüncü taraf makalelerden alınan bilgilerin kalitesi, doğruluğu veya eksiksizliğini garanti etmiyoruz. Bu sayfadaki içerik finansal veya yatırım tavsiyesi niteliği taşımaz. Yatırım kararları vermeden önce kendi araştırmanızı yapmanızı ve nitelikli bir finans danışmanına başvurmanızı şiddetle tavsiye ederiz.
