Resemble AI ha abierto el código de su avanzado modelo de generación de voz, DramaBox, en Hugging Face, marcando un salto significativo en la tecnología de voz por IA. DramaBox es el primer motor de voz diseñado para un control a nivel de director, permitiendo a los usuarios ingresar indicaciones escénicas como suspiros o susurros junto con el diálogo. Esto transforma las voces generadas por IA de salidas robóticas a interpretaciones emocionalmente ricas, eliminando la necesidad de actores de voz humanos o una extensa postproducción.
DramaBox cuenta con clonación de voz zero-shot, requiriendo solo 10 segundos de audio de referencia para imitar una voz objetivo. También permite a los usuarios establecer la edad, el acento y la emoción de un personaje mediante indicaciones en lenguaje natural, produciendo audio estéreo de calidad de estudio a 48kHz. Para prevenir el mal uso, todo el audio incluye una marca de agua invisible resistente a la compresión y edición. El modelo está construido sobre la base de audio LTX-2.3 de Lightricks e integra tecnologías avanzadas como Diffusion Transformer y Gemma 3 12B para el procesamiento de texto.
Resemble AI lanza DramaBox, un modelo de voz de código abierto con profundidad emocional
Aviso legal: El contenido de Phemex News es únicamente informativo.No garantizamos la calidad, precisión ni integridad de la información procedente de artículos de terceros.El contenido de esta página no constituye asesoramiento financiero ni de inversión.Le recomendamos encarecidamente que realice su propia investigación y consulte con un asesor financiero cualificado antes de tomar cualquier decisión de inversión.
