Chronicles-OCR da Tencent testa IA em scripts antigos

A Tencent, em colaboração com o SSV Digital Culture Lab e o Instituto de Engenharia da Informação da Academia Chinesa de Ciências, lançou o Chronicles-OCR, um benchmark para avaliar modelos de IA em scripts antigos. Esta iniciativa, que abrange as "Sete Transformações do Script", inclui 2.800 imagens anotadas e quantifica a dificuldade de reconhecimento em vários estilos de escrita, desde ossos oraculares até escrita cursiva. A avaliação de 28 dos principais modelos multimodais de linguagem revelou desafios significativos, com a maioria dos modelos falhando em reconhecer com precisão os scripts antigos. As métricas principais para modelos como GPT-5 e Gemini 2.5 Pro ficaram próximas de zero, e mesmo o melhor modelo alcançou apenas 16,5. Quando caixas delimitadoras foram adicionadas manualmente, a precisão atingiu o pico de 27,1%, com o Gemini 3.1 Pro marcando apenas 14,0% no script de osso oracular. O estudo destaca que os modelos modernos de IA têm dificuldades com mídias antigas não padronizadas e ruidosas, frequentemente identificando erroneamente texturas do substrato em vez dos traços dos caracteres. Além disso, ativar o modo de raciocínio reduziu a precisão, pois amplificou os erros em vez de corrigi-los.