Mẫu STEP3-VL-10B mới được StepFun AI công bố đang định nghĩa lại khả năng của các mô hình dưới 10 tỷ tham số. Mặc dù kích thước tương đối nhỏ, mô hình này mang lại hiệu suất tương đương với các đối thủ lớn hơn nhiều như GLM-4.6V-106B và Qwen3-VL-235B. Nó đạt được các điểm chuẩn ấn tượng, bao gồm 94,43% trên AIME2025 cho khả năng lý luận toán học và 80,11% trên MMMU cho hiểu biết đa phương thức chuyên sâu.
STEP3-VL-10B áp dụng một kỹ thuật mới gọi là Lý luận phối hợp song song (PaCoRe) để nâng cao khả năng tính toán trong thời gian kiểm tra. Quá trình phát triển mô hình bao gồm một quy trình hậu đào tạo nghiêm ngặt với hơn 1.000 vòng lặp Học tăng cường. Mô hình được huấn luyện trên 1,2 nghìn tỷ token đa phương thức, tập trung vào các lĩnh vực quan trọng như giáo dục K-12, OCR, giao diện người dùng đồ họa (GUI) và lý luận toán học.
Mô hình STEP3-VL-10B Thách thức Giới hạn Hiệu quả Dưới 10 Tỷ
Tuyên bố miễn trừ trách nhiệm: Nội dung được cung cấp trên Phemex News chỉ nhằm mục đích cung cấp thông tin.Chúng tôi không đảm bảo chất lượng, độ chính xác hoặc tính đầy đủ của thông tin có nguồn từ các bài viết của bên thứ ba.Nội dung trên trang này không cấu thành lời khuyên về tài chính hoặc đầu tư.Chúng tôi đặc biệt khuyến khích bạn tự tiến hành nghiên cứu và tham khảo ý kiến của cố vấn tài chính đủ tiêu chuẩn trước khi đưa ra bất kỳ quyết định đầu tư nào.
