Le modèle Gemini 3.2 fait ses débuts sur Google Cloud avec une inférence économique

Le modèle en temps réel Gemini 3.2 est désormais disponible sur Google Cloud, offrant une alternative économique à GPT-5.5. Le modèle, nommé "gemini-3.2-flash-lite-live-preview", a été ajouté à la console Google Cloud, marquant ses débuts publics sur une plateforme officielle. Cela fait suite à des apparitions précédentes dans des bundles d'applications iOS et AI Studio. Gemini 3.2 Flash atteint 92 % des capacités de codage et de raisonnement de GPT-5.5, mais à seulement un vingtième du coût d'inférence, grâce à des techniques avancées de distillation et de sparsification. La plupart des latences de requête sont inférieures à 200 millisecondes, ce qui le rend idéal pour des interactions en temps réel à latence ultra-faible. Les initiés de l'industrie s'attendent à son lancement officiel lors de Google I/O le 20 mai.

Source: Afficher l'original

Avertissement : Le contenu proposé sur Phemex News est à titre informatif uniquement. Nous ne garantissons pas la qualité, l'exactitude ou l'exhaustivité des informations provenant d'articles tiers. Ce contenu ne constitue pas un conseil financier ou d'investissement. Nous vous recommandons vivement d'effectuer vos propres recherches et de consulter un conseiller financier qualifié avant toute décision d'investissement.

Vous pourriez aussi aimer