Modelo da Thinking Machines Igual ao GPT-Realtime-2 em Benchmark de Áudio

O modelo TML-Interaction-Small da Thinking Machines empatou com o GPT-Realtime-2 (xHigh) da OpenAI na primeira posição do ranking Audio MC S2S da Scale Labs, alcançando uma pontuação APR de 43,4%. Apesar do GPT-Realtime-2 (xHigh) ter uma pontuação absoluta ligeiramente maior de 48,45 em comparação com os 43,36 do TML-Interaction-Small, a diferença está dentro das margens de erro estatístico, levando ambos os modelos a serem classificados como co-primeiros. A segunda posição do ranking é ocupada pelo GPT-Realtime-2 padrão, com uma pontuação de 37,61, seguido pelo Gemini 3.1 Flash Live com o modo de pensamento ativado, com 36,06, e pelo mais antigo GPT-Realtime-1.5. A Scale Labs destacou a rara consciência de contexto longo e os rápidos tempos de resposta conversacional do modelo TML-Interaction-Small entre os modelos full-duplex.

Fonte: Mostrar original

Aviso Legal: O conteúdo disponibilizado no Phemex News é apenas para fins informativos. Não garantimos a qualidade, precisão ou integridade das informações provenientes de artigos de terceiros. Este conteúdo não constitui aconselhamento financeiro ou de investimento. Recomendamos fortemente que você realize suas próprias pesquisas e consulte um consultor financeiro qualificado antes de tomar decisões de investimento.