Tencent, en colaboración con el Laboratorio de Cultura Digital SSV y el Instituto de Ingeniería de la Información de la Academia China de Ciencias, ha lanzado Chronicles-OCR, un referente para evaluar modelos de IA en escrituras antiguas. Esta iniciativa, que abarca las "Siete Transformaciones de la Escritura", incluye 2.800 imágenes anotadas y cuantifica la dificultad de reconocimiento a través de varios estilos de escritura, desde huesos oraculares hasta escritura cursiva. La evaluación de 28 modelos multimodales de lenguaje grande líderes reveló desafíos significativos, con la mayoría de los modelos fallando en reconocer con precisión las escrituras antiguas. Las métricas principales para modelos como GPT-5 y Gemini 2.5 Pro estuvieron cerca de cero, y el mejor modelo alcanzó solo 16.5. Cuando se añadieron manualmente las cajas delimitadoras, la precisión alcanzó un máximo del 27.1%, con Gemini 3.1 Pro obteniendo solo un 14.0% en escritura de hueso oracular. El estudio destaca que los modelos modernos de IA tienen dificultades con medios antiguos no estandarizados y ruidosos, a menudo identificando erróneamente texturas del sustrato en lugar de los trazos de los caracteres. Además, activar el modo de razonamiento redujo la precisión, ya que amplificó los errores en lugar de corregirlos.