Mô hình Gemini 3.2 ra mắt trên Google Cloud với khả năng suy luận tiết kiệm chi phí

Mô hình thời gian thực Gemini 3.2 hiện đã có trên Google Cloud, cung cấp một lựa chọn tiết kiệm chi phí thay thế cho GPT-5.5. Mô hình này, có tên "gemini-3.2-flash-lite-live-preview," đã được thêm vào Google Cloud Console, đánh dấu lần ra mắt công khai trên một nền tảng chính thức. Trước đó, nó đã xuất hiện trong các gói ứng dụng iOS và AI Studio. Gemini 3.2 Flash đạt được 92% khả năng lập trình và suy luận của GPT-5.5 nhưng chỉ với một phần hai mươi chi phí suy luận, nhờ vào các kỹ thuật chưng cất và làm thưa tiên tiến. Phần lớn độ trễ truy vấn dưới 200 mili giây, làm cho nó trở nên lý tưởng cho các tương tác thời gian thực với độ trễ cực thấp. Các chuyên gia trong ngành dự đoán nó sẽ được ra mắt chính thức tại Google I/O vào ngày 20 tháng 5.

Nguồn: Hiển thị bản gốc

Tuyên bố miễn trừ trách nhiệm: Nội dung được cung cấp trên Phemex News chỉ nhằm mục đích cung cấp thông tin.Chúng tôi không đảm bảo chất lượng, độ chính xác hoặc tính đầy đủ của thông tin có nguồn từ các bài viết của bên thứ ba.Nội dung trên trang này không cấu thành lời khuyên về tài chính hoặc đầu tư.Chúng tôi đặc biệt khuyến khích bạn tự tiến hành nghiên cứu và tham khảo ý kiến của cố vấn tài chính đủ tiêu chuẩn trước khi đưa ra bất kỳ quyết định đầu tư nào.

Bạn cũng có thể thích