Resemble AI DramaBox Ses Modelini Açık Kaynak Yaptı

Resemble AI, gelişmiş ses üretim modeli DramaBox'u Hugging Face üzerinde açık kaynak yaptı ve bu, yapay zeka ses teknolojisinde önemli bir ilerlemeyi işaret ediyor. DramaBox, yönetmen düzeyinde kontrol için tasarlanmış ilk ses motorudur ve kullanıcılara diyalogların yanı sıra iç çekme veya fısıltı gibi sahne yönlendirmeleri girmelerine olanak tanır. Bu, yapay zeka tarafından üretilen sesleri robotik çıktılardan duygusal açıdan zengin performanslara dönüştürerek insan seslendirme sanatçılarına veya kapsamlı post-prodüksiyona olan ihtiyacı ortadan kaldırır. DramaBox, hedef sesi taklit etmek için yalnızca 10 saniyelik referans sesi gerektiren sıfır atış ses klonlama özelliğine sahiptir. Ayrıca, kullanıcıların doğal dil komutlarıyla bir karakterin yaşını, aksanını ve duygusunu ayarlamasına izin verir ve stüdyo kalitesinde 48kHz stereo ses üretir. Kötüye kullanımı önlemek için tüm seslerde sıkıştırma ve düzenlemeye dayanıklı görünmez bir filigran bulunur. Model, Lightricks’in LTX-2.3 ses temeli üzerine inşa edilmiştir ve metin işleme için Diffusion Transformer ve Gemma 3 12B gibi gelişmiş teknolojileri entegre eder.

​​Beğenebileceğiniz Diğer İçerikler​​

Beğenebileceğiniz Diğer İçerikler