STEP3-VL-10B 모델, 10억 미만 효율 한계에 도전하다

StepFun AI가 새롭게 공개한 STEP3-VL-10B 모델은 100억 미만 파라미터 모델의 능력을 재정의하고 있습니다. 상대적으로 작은 크기임에도 불구하고, 이 모델은 GLM-4.6V-106B 및 Qwen3-VL-235B와 같은 훨씬 더 큰 모델들과 동등한 성능을 보여줍니다. 수학적 추론 분야의 AIME2025에서 94.43%, 전문가 수준의 다중 모달 이해를 요구하는 MMMU에서 80.11%라는 인상적인 벤치마크 점수를 기록했습니다. STEP3-VL-10B는 테스트 시 계산을 향상시키기 위해 병렬 협조 추론(Parallel Coordinated Reasoning, PaCoRe)이라는 새로운 기법을 도입했습니다. 이 모델은 1,000회 이상의 강화 학습 반복을 포함한 엄격한 사후 훈련 과정을 거쳤으며, K-12 교육, OCR, GUI, 수학적 추론 등 중요한 영역에 중점을 두고 1.2조 개의 다중 모달 토큰으로 학습되었습니다.

출처: 원본 보기

면책 조항: Phemex 뉴스에서 제공하는 콘텐츠는 정보 제공 목적으로만 제공됩니다. 제3자 기사에서 출처를 얻은 정보의 품질, 정확성 또는 완전성을 보장하지 않습니다.이 페이지의 콘텐츠는 재무 또는 투자 조언이 아닙니다.투자 결정을 내리기 전에 반드시 스스로 조사하고 자격을 갖춘 재무 전문가와 상담하시기 바랍니다.

함께 보면 좋은 콘텐츠