The Gemini 3.2 real-time model is now available on Google Cloud, offering a cost-effective alternative to GPT-5.5. The model, named "gemini-3.2-flash-lite-live-preview," has been added to the Google Cloud Console, marking its public debut on an official platform. This follows earlier appearances in iOS app bundles and AI Studio.
Gemini 3.2 Flash achieves 92% of GPT-5.5's coding and reasoning capabilities but at only one-twentieth of the inference cost, thanks to advanced distillation and sparsification techniques. Most query latencies are under 200 milliseconds, making it ideal for ultra-low-latency real-time interactions. Industry insiders expect its official launch at Google I/O on May 20.
Gemini 3.2 Model Debuts on Google Cloud with Cost-Effective Inference
Tuyên bố miễn trừ trách nhiệm: Nội dung được cung cấp trên Phemex News chỉ nhằm mục đích cung cấp thông tin.Chúng tôi không đảm bảo chất lượng, độ chính xác hoặc tính đầy đủ của thông tin có nguồn từ các bài viết của bên thứ ba.Nội dung trên trang này không cấu thành lời khuyên về tài chính hoặc đầu tư.Chúng tôi đặc biệt khuyến khích bạn tự tiến hành nghiên cứu và tham khảo ý kiến của cố vấn tài chính đủ tiêu chuẩn trước khi đưa ra bất kỳ quyết định đầu tư nào.
