Gemini 3.2モデルがGoogle Cloudでコスト効率の高い推論とともに登場

Gemini 3.2のリアルタイムモデルがGoogle Cloudで利用可能になり、GPT-5.5のコスト効率の高い代替手段を提供しています。このモデルは「gemini-3.2-flash-lite-live-preview」と名付けられ、Google Cloud Consoleに追加され、公式プラットフォームでの公開デビューを果たしました。これは、以前のiOSアプリバンドルやAI Studioでの登場に続くものです。 Gemini 3.2 Flashは、高度な蒸留およびスパース化技術のおかげで、GPT-5.5のコーディングおよび推論能力の92％を達成しながら、推論コストはわずか20分の1に抑えられています。ほとんどのクエリのレイテンシは200ミリ秒未満であり、超低遅延のリアルタイムインタラクションに最適です。業界関係者は、5月20日のGoogle I/Oでの公式発表を期待しています。

出典: 原文を表示

免責事項: Phemexニュースで提供されるコンテンツは、あくまで情報提供を目的としたものであり、第三者の記事から取得した情報の正確性・完全性・信頼性について保証するものではありません。本コンテンツは金融または投資の助言を目的としたものではなく、投資に関する最終判断はご自身での調査と、信頼できる専門家への相談を踏まえて行ってください。

​​こちらもおすすめ​​

こちらもおすすめ