El modelo Gemini 3.2 debuta en Google Cloud con inferencia rentable

El modelo en tiempo real Gemini 3.2 ya está disponible en Google Cloud, ofreciendo una alternativa rentable a GPT-5.5. El modelo, llamado "gemini-3.2-flash-lite-live-preview", ha sido añadido a la Consola de Google Cloud, marcando su debut público en una plataforma oficial. Esto sigue a apariciones anteriores en paquetes de aplicaciones iOS y AI Studio. Gemini 3.2 Flash alcanza el 92% de las capacidades de codificación y razonamiento de GPT-5.5, pero a solo una vigésima parte del costo de inferencia, gracias a técnicas avanzadas de destilación y esparcimiento. La mayoría de las latencias de consulta están por debajo de los 200 milisegundos, lo que lo hace ideal para interacciones en tiempo real con latencia ultra baja. Los expertos de la industria esperan su lanzamiento oficial en Google I/O el 20 de mayo.

Fuente: Mostrar original

Aviso legal: El contenido de Phemex News es únicamente informativo.No garantizamos la calidad, precisión ni integridad de la información procedente de artículos de terceros.El contenido de esta página no constituye asesoramiento financiero ni de inversión.Le recomendamos encarecidamente que realice su propia investigación y consulte con un asesor financiero cualificado antes de tomar cualquier decisión de inversión.

También te podría gustar