딥마인드 AI 공동수학자, GPT-5.5 프로 능가

구글 딥마인드는 복잡한 수학 문제 해결에 새로운 기준을 세운 획기적인 인터랙티브 연구 작업 공간인 AI 공동수학자(AI Co-Mathematician)를 공개했습니다. 이 시스템은 도전적인 FrontierMath Tier 4 벤치마크에서 47.9%의 정확도를 기록하며 48문제 중 23문제를 해결해, 이전 GPT-5.5 Pro가 보유한 39.6%의 기록을 뛰어넘었습니다. 이전 모델들과 달리 AI 공동수학자는 차세대 기초 모델 대신 멀티 에이전트 프레임워크를 활용하며, Gemini 3.1 Pro를 통해 전문화된 에이전트 간 작업을 조율합니다. 시스템 아키텍처에는 문헌 검색, 코드 생성, 추론에 집중하는 에이전트들에게 작업을 할당하는 "프로젝트 코디네이터"가 포함되어 있으며, 모든 증명은 "검토 에이전트" 패널에 의해 검토됩니다. 이러한 협업 방식 덕분에 기존 모델로는 해결할 수 없었던 문제들을 해결할 수 있었습니다. 특히 수학자 마크 라켄비가 Kourovka 노트북에 오랫동안 남아 있던 추측을 해결하는 데 도움을 주었습니다. 현재 AI 공동수학자는 제한된 내부 테스트 단계에 있으며, 일부 수학자 그룹에게만 제공되고 있습니다.