Tencent, en collaboration avec le SSV Digital Culture Lab et l'Institut d'Ingénierie de l'Information de l'Académie chinoise des sciences, a lancé Chronicles-OCR, une référence pour évaluer les modèles d'IA sur les écritures anciennes. Cette initiative, couvrant les « Sept transformations de l'écriture », comprend 2 800 images annotées et quantifie la difficulté de reconnaissance à travers divers styles d'écriture, de l'os d'oracle à l'écriture cursive. L'évaluation de 28 grands modèles multimodaux de langage a révélé des défis importants, la plupart des modèles échouant à reconnaître avec précision les écritures anciennes. Les métriques principales pour des modèles comme GPT-5 et Gemini 2.5 Pro étaient proches de zéro, et même le meilleur modèle n'a atteint que 16,5. Lorsque des boîtes englobantes ont été ajoutées manuellement, la précision a culminé à 27,1 %, Gemini 3.1 Pro obtenant seulement 14,0 % sur l'écriture sur os d'oracle. L'étude souligne que les modèles d'IA modernes ont du mal avec des médias anciens non standardisés et bruyants, identifiant souvent à tort les textures du substrat au lieu des traits des caractères. De plus, l'activation du mode raisonnement a réduit la précision, car elle amplifiait les erreurs au lieu de les corriger.