Tencent Chronicles-OCR: тесты ИИ на древних текстах

Tencent в сотрудничестве с SSV Digital Culture Lab и Институтом информационной инженерии Китайской академии наук запустила Chronicles-OCR — эталон для оценки моделей ИИ по древним письменам. Эта инициатива, охватывающая «Семь трансформаций письма», включает 2800 аннотированных изображений и количественно оценивает сложность распознавания различных стилей письма — от гадательных костей до скорописи. Оценка 28 ведущих мультимодальных больших языковых моделей выявила значительные трудности: большинство моделей не смогли точно распознать древние письмена. Основные показатели таких моделей, как GPT-5 и Gemini 2.5 Pro, были близки к нулю, а лучшая модель достигла лишь 16,5. При ручном добавлении ограничивающих рамок точность достигла максимума в 27,1%, при этом Gemini 3.1 Pro показала всего 14,0% на гадательных костях. Исследование подчеркивает, что современные модели ИИ испытывают трудности с нестандартизированными, шумными древними носителями, часто ошибочно принимая текстуры подложки за штрихи символов. Кроме того, включение режима рассуждения снижало точность, так как усиливало ошибки, а не исправляло их.