Tencent, en collaboration avec le SSV Digital Culture Lab et l'Institut d'Ingénierie de l'Information de l'Académie chinoise des sciences, a lancé Chronicles-OCR, une référence pour évaluer les modèles d'IA sur les écritures anciennes. Cette initiative, couvrant les « Sept transformations de l'écriture », comprend 2 800 images annotées et quantifie la difficulté de reconnaissance à travers divers styles d'écriture, de l'os d'oracle à l'écriture cursive.
L'évaluation de 28 grands modèles multimodaux de langage a révélé des défis importants, la plupart des modèles échouant à reconnaître avec précision les écritures anciennes. Les métriques principales pour des modèles comme GPT-5 et Gemini 2.5 Pro étaient proches de zéro, et même le meilleur modèle n'a atteint que 16,5. Lorsque des boîtes englobantes ont été ajoutées manuellement, la précision a culminé à 27,1 %, Gemini 3.1 Pro obtenant seulement 14,0 % sur l'écriture sur os d'oracle. L'étude souligne que les modèles d'IA modernes ont du mal avec des médias anciens non standardisés et bruyants, identifiant souvent à tort les textures du substrat au lieu des traits des caractères. De plus, l'activation du mode raisonnement a réduit la précision, car elle amplifiait les erreurs au lieu de les corriger.
Tencent lance Chronicles-OCR pour évaluer l'IA sur les écritures anciennes
Avertissement : Le contenu proposé sur Phemex News est à titre informatif uniquement. Nous ne garantissons pas la qualité, l'exactitude ou l'exhaustivité des informations provenant d'articles tiers. Ce contenu ne constitue pas un conseil financier ou d'investissement. Nous vous recommandons vivement d'effectuer vos propres recherches et de consulter un conseiller financier qualifié avant toute décision d'investissement.
