A Resemble AI tornou seu avançado modelo de geração de voz, DramaBox, de código aberto no Hugging Face, marcando um avanço significativo na tecnologia de voz por IA. O DramaBox é o primeiro motor de voz projetado para controle em nível de diretor, permitindo que os usuários insiram direções de palco, como suspiros ou sussurros, junto com o diálogo. Isso transforma as vozes geradas por IA de saídas robóticas para performances emocionalmente ricas, eliminando a necessidade de atores de voz humanos ou pós-produção extensa.
O DramaBox apresenta clonagem de voz zero-shot, exigindo apenas 10 segundos de áudio de referência para imitar uma voz alvo. Também permite que os usuários definam a idade, o sotaque e a emoção de um personagem por meio de comandos em linguagem natural, produzindo áudio estéreo de qualidade de estúdio a 48kHz. Para evitar uso indevido, todo o áudio inclui uma marca d'água invisível resistente à compressão e edição. O modelo é construído sobre a base de áudio LTX-2.3 da Lightricks e integra tecnologias avançadas como Diffusion Transformer e Gemma 3 12B para processamento de texto.
Resemble AI Lança DramaBox, um Modelo de Voz Open-Source com Profundidade Emocional
Aviso Legal: O conteúdo disponibilizado no Phemex News é apenas para fins informativos. Não garantimos a qualidade, precisão ou integridade das informações provenientes de artigos de terceiros. Este conteúdo não constitui aconselhamento financeiro ou de investimento. Recomendamos fortemente que você realize suas próprias pesquisas e consulte um consultor financeiro qualificado antes de tomar decisões de investimento.
