Resemble AI libera modelo de voz DramaBox

A Resemble AI tornou seu avançado modelo de geração de voz, DramaBox, de código aberto no Hugging Face, marcando um avanço significativo na tecnologia de voz por IA. O DramaBox é o primeiro motor de voz projetado para controle em nível de diretor, permitindo que os usuários insiram direções de palco, como suspiros ou sussurros, junto com o diálogo. Isso transforma as vozes geradas por IA de saídas robóticas para performances emocionalmente ricas, eliminando a necessidade de atores de voz humanos ou pós-produção extensa. O DramaBox apresenta clonagem de voz zero-shot, exigindo apenas 10 segundos de áudio de referência para imitar uma voz alvo. Também permite que os usuários definam a idade, o sotaque e a emoção de um personagem por meio de comandos em linguagem natural, produzindo áudio estéreo de qualidade de estúdio a 48kHz. Para evitar uso indevido, todo o áudio inclui uma marca d'água invisível resistente à compressão e edição. O modelo é construído sobre a base de áudio LTX-2.3 da Lightricks e integra tecnologias avançadas como Diffusion Transformer e Gemma 3 12B para processamento de texto.

Você também pode gostar