アリババのQwenチームは、Alibaba CloudのBailianプラットフォーム上でQwen3.7-Maxモデル向けに自動的な暗黙のキャッシュ機能を導入しました。これにより、入力コストを最大80%削減することが可能となりました。この新機能により、開発者はコードの変更やパラメータの追加なしにコスト削減の恩恵を受けることができます。システムはリクエスト内の繰り返されるコンテキストの接頭辞を識別し、一致した入力トークンに対しては標準料金の20%のみを課金します。
この暗黙のキャッシュは、長文やエージェントタスクのシナリオで特に有効であり、Qwen3.7-Maxは大規模なコードベースやドキュメントを頻繁に処理します。この動きは、最近キャッシュヒット課金を100万トークンあたり0.003625ドルに引き下げたDeepSeek V4-Proなどの競争的な価格圧力の中で行われました。これに対抗して、Qwen3.7-Maxはさらに低コストを実現する明示的なキャッシュモードも提供していますが、こちらは手動での設定が必要です。
アリババクラウド、Qwen3.7-Max向けに暗黙のキャッシュ機能を導入し、入力コストを80%削減
免責事項: Phemexニュースで提供されるコンテンツは、あくまで情報提供を目的としたものであり、第三者の記事から取得した情報の正確性・完全性・信頼性について保証するものではありません。本コンテンツは金融または投資の助言を目的としたものではなく、投資に関する最終判断はご自身での調査と、信頼できる専門家への相談を踏まえて行ってください。
