Thinking MachinesのTML-Interaction-Smallモデルは、Scale LabsのAudio MC S2SリーダーボードでOpenAIのGPT-Realtime-2(xHigh)と同率首位となり、APRスコア43.4%を達成しました。GPT-Realtime-2(xHigh)はTML-Interaction-Smallの43.36に対してわずかに高い絶対スコア48.45を持っていますが、その差は統計的誤差の範囲内であるため、両モデルは共同首位と評価されました。 リーダーボードの第2層には、標準のGPT-Realtime-2が37.61のスコアで続き、思考モードが有効なGemini 3.1 Flash Liveが36.06、そして旧バージョンのGPT-Realtime-1.5が続きます。Scale Labsは、TML-Interaction-Smallモデルがフルデュプレックスモデルの中で稀な長文脈認識能力と高速な会話応答時間を持つことを強調しました。