Googleは、Gemini 3シリーズの新モデルであるGemini 3.1 Flash-Liteを発表しました。これは最速かつ最もコスト効率の高いオプションとして設計されています。Mixture of Experts(MoE)アーキテクチャを活用し、パラメータの一部のみをアクティブにすることで推論コストを削減しています。APIの価格は、入力トークン100万あたり0.25ドル、出力トークン100万あたり1.50ドルに設定されており、Gemini 3.1 Proよりも大幅に安価です。
Gemini 3.1 Flash-Liteは、最初のトークンのレイテンシを2.5倍削減し、出力速度を45%向上させ、1秒あたり363トークンに達するなど、性能指標が改善されています。最大100万入力トークンと64,000出力トークンをサポートし、テキスト、画像、音声、動画の入力に対応しています。内部ベンチマークでは、GPQA DiamondやMMMU-Proを含む11のテストのうち6つでGPT-5 MiniやClaude 4.5 Haikuを上回りました。このモデルの「思考レベル」機能により、開発者は推論の深さを調整して品質とコストを最適化できます。プレビューアクセスはGemini APIおよびVertex AIを通じて利用可能です。
グーグル、コスト削減と競合他社を凌駕するGemini 3.1 Flash-Liteを発表
免責事項: Phemexニュースで提供されるコンテンツは、あくまで情報提供を目的としたものであり、第三者の記事から取得した情報の正確性・完全性・信頼性について保証するものではありません。本コンテンツは金融または投資の助言を目的としたものではなく、投資に関する最終判断はご自身での調査と、信頼できる専門家への相談を踏まえて行ってください。
