Nhóm Qwen của Alibaba đã giới thiệu Qwen-Image-Bench, một bộ chuẩn mã nguồn mở được thiết kế để đánh giá khả năng chuyển đổi văn bản thành hình ảnh của các mô hình lớn. Cùng với bản phát hành này là Q-Judger, một mô hình đánh giá hình ảnh được huấn luyện trên Qwen3.6-27B, đánh giá các mô hình theo năm chiều: chất lượng hình ảnh, thẩm mỹ, sự phù hợp giữa văn bản và hình ảnh, độ chân thực trong thế giới thực và khả năng sáng tạo. Bộ chuẩn bao gồm 1.000 câu lệnh song ngữ và đánh giá các mô hình dựa trên 56 chỉ số chi tiết.
Các đánh giá ban đầu cho thấy GPT Image 2 dẫn đầu với điểm tổng hợp 64,69, xuất sắc ở cả năm hạng mục. Các ứng viên hàng đầu khác bao gồm Nano Banana 2.0 và GPT Image 1.5. Qwen Image 2.0 Pro của Alibaba xếp thứ năm. Đánh giá này làm nổi bật những thách thức phổ biến trong việc tạo hình ảnh AI, chẳng hạn như khó khăn với giải phẫu bàn tay người và việc thể hiện các quy luật vật lý.
Alibaba Ra Mắt Qwen-Image-Bench Để Đánh Giá Các Mô Hình Chuyển Đổi Văn Bản Thành Hình Ảnh
Tuyên bố miễn trừ trách nhiệm: Nội dung được cung cấp trên Phemex News chỉ nhằm mục đích cung cấp thông tin.Chúng tôi không đảm bảo chất lượng, độ chính xác hoặc tính đầy đủ của thông tin có nguồn từ các bài viết của bên thứ ba.Nội dung trên trang này không cấu thành lời khuyên về tài chính hoặc đầu tư.Chúng tôi đặc biệt khuyến khích bạn tự tiến hành nghiên cứu và tham khảo ý kiến của cố vấn tài chính đủ tiêu chuẩn trước khi đưa ra bất kỳ quyết định đầu tư nào.
