元OpenAI CTOのミラ・ムラティが率いるThinking Machines Labは、「インタラクティブモデル」と呼ばれる音声AIインタラクションを革新するための研究プレビューを発表しました。従来のターン制システムで動作するモデルとは異なり、これらの新しいモデルはユーザーの入力を同時に受け取りながら応答を生成でき、より自然で電話のような会話体験を実現します。この「フルデュプレックス」技術により、AIは継続的にコンテキストを理解し応答を準備でき、TML-Interaction-Smallモデルは約0.40秒の応答時間を達成しています。 現在、この技術は研究プレビュー段階にあり、一般公開はされていません。Thinking Machinesは今後数ヶ月で限定的な研究プレビューを計画しており、今年後半にはより広範な展開を予定しています。同社はインタラクティブ機能をモデルに直接統合することを目指しており、音声アシスタントや会話型AI製品の利用を変革する可能性があります。しかし、実際の性能やユーザー体験は製品が公開された後に検証される必要があります。