Resemble AI libera modelo de voz DramaBox

Resemble AI ha abierto el código de su avanzado modelo de generación de voz, DramaBox, en Hugging Face, marcando un salto significativo en la tecnología de voz por IA. DramaBox es el primer motor de voz diseñado para un control a nivel de director, permitiendo a los usuarios ingresar indicaciones escénicas como suspiros o susurros junto con el diálogo. Esto transforma las voces generadas por IA de salidas robóticas a interpretaciones emocionalmente ricas, eliminando la necesidad de actores de voz humanos o una extensa postproducción. DramaBox cuenta con clonación de voz zero-shot, requiriendo solo 10 segundos de audio de referencia para imitar una voz objetivo. También permite a los usuarios establecer la edad, el acento y la emoción de un personaje mediante indicaciones en lenguaje natural, produciendo audio estéreo de calidad de estudio a 48kHz. Para prevenir el mal uso, todo el audio incluye una marca de agua invisible resistente a la compresión y edición. El modelo está construido sobre la base de audio LTX-2.3 de Lightricks e integra tecnologías avanzadas como Diffusion Transformer y Gemma 3 12B para el procesamiento de texto.

También te podría gustar