Tencent, SSV Dijital Kültür Laboratuvarı ve Çin Bilimler Akademisi Bilgi Mühendisliği Enstitüsü iş birliğiyle, eski yazılar üzerinde yapay zeka modellerini değerlendirmek için bir kıyaslama aracı olan Chronicles-OCR'yi başlattı. "Yazının Yedi Dönüşümü"nü kapsayan bu girişim, 2.800 açıklamalı görüntü içeriyor ve yazıt kemik yazısından el yazısına kadar çeşitli yazı stillerinde tanıma zorluğunu ölçüyor. 28 önde gelen çok modlu büyük dil modelinin değerlendirilmesi önemli zorlukları ortaya koydu; çoğu model eski yazıları doğru şekilde tanıyamadı. GPT-5 ve Gemini 2.5 Pro gibi modellerin temel metrikleri neredeyse sıfıra yakındı ve en iyi model bile sadece 16,5 puan alabildi. Sınırlayıcı kutular manuel olarak eklendiğinde doğruluk %27,1'e yükseldi, Gemini 3.1 Pro ise yazıt kemik yazısında sadece %14,0 puan aldı. Çalışma, modern yapay zeka modellerinin standart dışı, gürültülü eski medyayla mücadele ettiğini, karakter çizgileri yerine genellikle alt tabaka dokularını yanlış tanımladığını vurguluyor. Ayrıca, akıl yürütme modunun etkinleştirilmesi doğruluğu düşürdü çünkü hataları düzeltmek yerine artırdı.