GoogleはGemini APIに対して新しい階層型の価格戦略を導入しました。これには、標準(Standard)、フレキシブル(Flexible)、プライオリティ(Priority)、バッチ(Batch)、キャッシュ(Cache)の5つの異なるサービスレベルが含まれます。フレキシブルおよびバッチの階層は標準料金の50%割引を提供し、それぞれ低遅延感度のアプリケーションや大規模なデータ処理ニーズに対応しています。キャッシュ階層は高頻度で複雑な命令呼び出し向けに設計されており、トークン数と保存期間に基づいて課金されます。 プライオリティ階層は標準料金より75%から100%高い価格設定で、ミリ秒から数秒の迅速な応答時間を保証し、カスタマーサービスボットやリアルタイムの不正検出などの重要なアプリケーションに適しています。この新しい価格モデルは、AI推論サービスのリソース配分を最適化し、さまざまな遅延およびコスト要件に対応することを目的としています。