ARC-AGI-3: Тест интеллекта ИИ-агентов

Фонд ARC Prize запустил эталон ARC-AGI-3 — новый инструмент, предназначенный для оценки истинного интеллекта ИИ-агентов. В отличие от своих предшественников, ARC-AGI-3 работает в интерактивной пошаговой среде с сеткой 64×64, где ИИ-агенты должны самостоятельно исследовать, выводить правила и планировать действия без заранее заданных инструкций. Этот эталон делает акцент на "эффективности действий", вознаграждая агентов, которые решают задачи с меньшим количеством шагов, тем самым подчеркивая подлинное рассуждение, а не методы перебора. Выпуск эталона последовал за опасениями, что предыдущие версии были скомпрометированы данными для обучения ИИ-моделей. ARC-AGI-3 стремится предотвратить такие проблемы благодаря функции автономного обнаружения целей. Текущие результаты ведущих ИИ-моделей включают Google Gemini 3.1 Pro Preview с 0,37% и OpenAI GPT-5.4 (High) с 0,26%. Премия ARC Prize 2026 предлагает более 2 миллионов долларов призовых для лучших ИИ-агентов.