Mô hình TML-Interaction-Small của Thinking Machines đã cùng chia sẻ vị trí đầu bảng với GPT-Realtime-2 (xHigh) của OpenAI trên bảng xếp hạng Audio MC S2S của Scale Labs, đạt điểm APR là 43,4%. Mặc dù GPT-Realtime-2 (xHigh) có điểm tuyệt đối cao hơn một chút là 48,45 so với 43,36 của TML-Interaction-Small, sự khác biệt này nằm trong phạm vi sai số thống kê, dẫn đến việc cả hai mô hình được xếp hạng đồng hạng nhất. Hạng hai trên bảng xếp hạng thuộc về GPT-Realtime-2 tiêu chuẩn với điểm số 37,61, tiếp theo là Gemini 3.1 Flash Live với chế độ suy nghĩ được bật ở mức 36,06, và GPT-Realtime-1.5 cũ hơn. Scale Labs đã nhấn mạnh khả năng nhận thức ngữ cảnh dài hiếm có và thời gian phản hồi hội thoại nhanh của mô hình TML-Interaction-Small trong số các mô hình full-duplex.