StepFun AIが新たに発表したSTEP3-VL-10Bモデルは、100億パラメータ未満のモデルの能力を再定義しています。比較的小規模でありながら、このモデルはGLM-4.6V-106BやQwen3-VL-235Bのようなはるかに大きなモデルと同等の性能を発揮しています。数学的推論においてAIME2025で94.43%、専門的なマルチモーダル理解においてMMMUで80.11%という印象的なベンチマークスコアを達成しました。 STEP3-VL-10Bは、テスト時の計算を強化するためにParallel Coordinated Reasoning(PaCoRe)と呼ばれる新しい技術を取り入れています。このモデルの開発には、1,000回以上の強化学習の反復を含む厳格なポストトレーニングプロセスが行われました。1.2兆のマルチモーダルトークンで訓練され、K-12教育、OCR、GUI、数学的推論などの重要分野に重点を置いています。