StepFun AI가 새롭게 공개한 STEP3-VL-10B 모델은 100억 미만 파라미터 모델의 능력을 재정의하고 있습니다. 상대적으로 작은 크기임에도 불구하고, 이 모델은 GLM-4.6V-106B 및 Qwen3-VL-235B와 같은 훨씬 더 큰 모델들과 동등한 성능을 보여줍니다. 수학적 추론 분야의 AIME2025에서 94.43%, 전문가 수준의 다중 모달 이해를 요구하는 MMMU에서 80.11%라는 인상적인 벤치마크 점수를 기록했습니다. STEP3-VL-10B는 테스트 시 계산을 향상시키기 위해 병렬 협조 추론(Parallel Coordinated Reasoning, PaCoRe)이라는 새로운 기법을 도입했습니다. 이 모델은 1,000회 이상의 강화 학습 반복을 포함한 엄격한 사후 훈련 과정을 거쳤으며, K-12 교육, OCR, GUI, 수학적 추론 등 중요한 영역에 중점을 두고 1.2조 개의 다중 모달 토큰으로 학습되었습니다.