O modelo TML-Interaction-Small da Thinking Machines empatou com o GPT-Realtime-2 (xHigh) da OpenAI na primeira posição do ranking Audio MC S2S da Scale Labs, alcançando uma pontuação APR de 43,4%. Apesar do GPT-Realtime-2 (xHigh) ter uma pontuação absoluta ligeiramente maior de 48,45 em comparação com os 43,36 do TML-Interaction-Small, a diferença está dentro das margens de erro estatístico, levando ambos os modelos a serem classificados como co-primeiros. A segunda posição do ranking é ocupada pelo GPT-Realtime-2 padrão, com uma pontuação de 37,61, seguido pelo Gemini 3.1 Flash Live com o modo de pensamento ativado, com 36,06, e pelo mais antigo GPT-Realtime-1.5. A Scale Labs destacou a rara consciência de contexto longo e os rápidos tempos de resposta conversacional do modelo TML-Interaction-Small entre os modelos full-duplex.