テンセントは、中国科学院情報工学研究所およびSSVデジタルカルチャーラボと協力し、古代文字のAIモデル評価のためのベンチマーク「Chronicles-OCR」を発表しました。この取り組みは「七変化の書体」をカバーし、2,800枚の注釈付き画像を含み、甲骨文字から草書体まで様々な書体の認識難易度を定量化しています。
28の主要なマルチモーダル大規模言語モデルの評価では、多くのモデルが古代文字を正確に認識できず、大きな課題が明らかになりました。GPT-5やGemini 2.5 Proのコア指標はほぼゼロで、最良のモデルでも16.5にとどまりました。バウンディングボックスを手動で追加した場合、精度は27.1%に達し、Gemini 3.1 Proは甲骨文字でわずか14.0%のスコアでした。本研究は、現代のAIモデルが非標準化でノイズの多い古代の媒体に苦戦し、文字の筆画ではなく基盤のテクスチャを誤認識することが多いことを示しています。さらに、推論モードを有効にすると、誤りを修正するのではなく増幅させるため、精度が低下しました。
テンセント、古代文字のAI評価のためにChronicles-OCRを発表
免責事項: Phemexニュースで提供されるコンテンツは、あくまで情報提供を目的としたものであり、第三者の記事から取得した情報の正確性・完全性・信頼性について保証するものではありません。本コンテンツは金融または投資の助言を目的としたものではなく、投資に関する最終判断はご自身での調査と、信頼できる専門家への相談を踏まえて行ってください。
