DeepMind AI共同数学者がGPT-5.5 Proを超える

Google DeepMindは、複雑な数学的問題の解決において新たな基準を打ち立てた画期的なインタラクティブ研究ワークスペース「AI Co-Mathematician」を発表しました。このシステムは、難関のFrontierMath Tier 4ベンチマークで47.9％の正確率を達成し、48問中23問を解決、従来のGPT-5.5 Proが保持していた39.6％の記録を上回りました。従来のモデルとは異なり、AI Co-Mathematicianは次世代の基盤モデルではなく、複数のエージェントが協調するマルチエージェントフレームワークを採用し、Gemini 3.1 Proを用いて専門エージェント間のタスクを調整しています。システムのアーキテクチャには、「プロジェクトコーディネーター」が含まれており、文献検索、コード生成、推論に特化したエージェントにタスクを割り当て、すべての証明は「レビュアーエージェント」のパネルによって検証されます。この協調的なアプローチにより、既存のモデルでは解決できなかった問題の解決が可能となりました。特に、数学者マーク・ラッケンビーが長年未解決だったKourovka Notebookの予想の解決を支援しました。現在、AI Co-Mathematicianは限定的な内部テスト段階にあり、選ばれた数学者のグループにのみ利用可能です。