Thách Thức Mô Hình STEP3-VL-10B Giới Hạn Hiệu Suất Sub-10B

Mẫu STEP3-VL-10B mới được StepFun AI công bố đang định nghĩa lại khả năng của các mô hình dưới 10 tỷ tham số. Mặc dù kích thước tương đối nhỏ, mô hình này mang lại hiệu suất tương đương với các đối thủ lớn hơn nhiều như GLM-4.6V-106B và Qwen3-VL-235B. Nó đạt được các điểm chuẩn ấn tượng, bao gồm 94,43% trên AIME2025 cho khả năng lý luận toán học và 80,11% trên MMMU cho hiểu biết đa phương thức chuyên sâu. STEP3-VL-10B áp dụng một kỹ thuật mới gọi là Lý luận phối hợp song song (PaCoRe) để nâng cao khả năng tính toán trong thời gian kiểm tra. Quá trình phát triển mô hình bao gồm một quy trình hậu đào tạo nghiêm ngặt với hơn 1.000 vòng lặp Học tăng cường. Mô hình được huấn luyện trên 1,2 nghìn tỷ token đa phương thức, tập trung vào các lĩnh vực quan trọng như giáo dục K-12, OCR, giao diện người dùng đồ họa (GUI) và lý luận toán học.

Bạn cũng có thể thích