Gemini 3 Flash、OpenClawタスクで95.1％の成功率を達成しトップに立つ

Gemini 3 Flashは、PinchBenchベンチマークテストによると、OpenClawエージェントタスクで95.1％の成功率を達成し、最も優れたAIモデルとして浮上しました。Xプラットフォーム上でSlowMistのCISO 23padsによって強調された評価では、minimax-m2.1とkimi-k2.5がそれぞれ93.6％と93.4％の成功率で2位と3位にランクインしています。Claude Sonnet 4.5は92.7％で続き、GPT-4oは85.2％の成功率を記録しています。

出典: 原文を表示

免責事項: Phemexニュースで提供されるコンテンツは、あくまで情報提供を目的としたものであり、第三者の記事から取得した情報の正確性・完全性・信頼性について保証するものではありません。本コンテンツは金融または投資の助言を目的としたものではなく、投資に関する最終判断はご自身での調査と、信頼できる専門家への相談を踏まえて行ってください。