ByteDance Research đã công khai mã nguồn của Lance, một mô hình đa phương thức với 3 tỷ tham số được thiết kế để xử lý hình ảnh và video. Được huấn luyện trên 128 GPU A100, Lance hỗ trợ đồng thời việc hiểu, tạo và chỉnh sửa trong cùng một khung làm việc. Khác với các mô hình khác tăng kích thước tham số, Lance sử dụng kiến trúc Mixture-of-Experts hai luồng và mã hóa vị trí quay nhận thức theo phương thức để quản lý hiệu quả tính toán và giảm nhiễu tín hiệu.
Mặc dù thiết kế nhẹ, Lance vẫn xuất sắc trong các bài kiểm tra chuẩn về tạo và chỉnh sửa hình ảnh và video, thể hiện một phương pháp tiết kiệm chi phí để cân bằng khả năng tạo và hiểu ngữ nghĩa. Phát triển này làm nổi bật chiến lược đổi mới của ByteDance trong AI đa phương thức, cung cấp một giải pháp tính toán thấp nhưng vẫn duy trì hiệu suất cao.
ByteDance Mở Mã Nguồn Lance, Mô Hình Đa Modal 3 Tỷ Tham Số
Tuyên bố miễn trừ trách nhiệm: Nội dung được cung cấp trên Phemex News chỉ nhằm mục đích cung cấp thông tin.Chúng tôi không đảm bảo chất lượng, độ chính xác hoặc tính đầy đủ của thông tin có nguồn từ các bài viết của bên thứ ba.Nội dung trên trang này không cấu thành lời khuyên về tài chính hoặc đầu tư.Chúng tôi đặc biệt khuyến khích bạn tự tiến hành nghiên cứu và tham khảo ý kiến của cố vấn tài chính đủ tiêu chuẩn trước khi đưa ra bất kỳ quyết định đầu tư nào.
