STEP3-VL-10Bモデル、サブ10Bの効率限界に挑戦

StepFun AIが新たに発表したSTEP3-VL-10Bモデルは、100億パラメータ未満のモデルの能力を再定義しています。比較的小規模でありながら、このモデルはGLM-4.6V-106BやQwen3-VL-235Bのようなはるかに大きなモデルと同等の性能を発揮しています。数学的推論においてAIME2025で94.43％、専門的なマルチモーダル理解においてMMMUで80.11％という印象的なベンチマークスコアを達成しました。 STEP3-VL-10Bは、テスト時の計算を強化するためにParallel Coordinated Reasoning（PaCoRe）と呼ばれる新しい技術を取り入れています。このモデルの開発には、1,000回以上の強化学習の反復を含む厳格なポストトレーニングプロセスが行われました。1.2兆のマルチモーダルトークンで訓練され、K-12教育、OCR、GUI、数学的推論などの重要分野に重点を置いています。

出典: 原文を表示

免責事項: Phemexニュースで提供されるコンテンツは、あくまで情報提供を目的としたものであり、第三者の記事から取得した情報の正確性・完全性・信頼性について保証するものではありません。本コンテンツは金融または投資の助言を目的としたものではなく、投資に関する最終判断はご自身での調査と、信頼できる専門家への相談を踏まえて行ってください。

​​こちらもおすすめ​​

こちらもおすすめ