Tencent, phối hợp với Phòng thí nghiệm Văn hóa Kỹ thuật số SSV và Viện Kỹ thuật Thông tin thuộc Viện Hàn lâm Khoa học Trung Quốc, đã ra mắt Chronicles-OCR, một chuẩn đánh giá các mô hình AI trên các chữ viết cổ đại. Sáng kiến này, bao gồm "Bảy Biến đổi của Chữ viết," có 2.800 hình ảnh được chú thích và định lượng độ khó nhận dạng qua nhiều phong cách chữ viết khác nhau, từ chữ giáp cốt đến chữ viết tay. Việc đánh giá 28 mô hình ngôn ngữ lớn đa phương tiện hàng đầu đã tiết lộ những thách thức đáng kể, với hầu hết các mô hình không thể nhận dạng chính xác các chữ viết cổ đại. Các chỉ số cốt lõi của các mô hình như GPT-5 và Gemini 2.5 Pro gần như bằng không, và ngay cả mô hình tốt nhất cũng chỉ đạt 16,5. Khi các hộp giới hạn được thêm thủ công, độ chính xác đạt đỉnh ở mức 27,1%, với Gemini 3.1 Pro chỉ đạt 14,0% trên chữ giáp cốt. Nghiên cứu nhấn mạnh rằng các mô hình AI hiện đại gặp khó khăn với các phương tiện cổ đại không chuẩn hóa, nhiều nhiễu, thường nhầm lẫn kết cấu nền thay vì các nét chữ. Thêm vào đó, việc bật chế độ suy luận làm giảm độ chính xác, vì nó khuếch đại lỗi thay vì sửa chữa chúng.