アリババのQwenチームは、Alibaba CloudのBailianプラットフォーム上でQwen3.7-Maxモデル向けに自動的な暗黙のキャッシュ機能を導入しました。これにより、入力コストを最大80%削減することが可能となりました。この新機能により、開発者はコードの変更やパラメータの追加なしにコスト削減の恩恵を受けることができます。システムはリクエスト内の繰り返されるコンテキストの接頭辞を識別し、一致した入力トークンに対しては標準料金の20%のみを課金します。 この暗黙のキャッシュは、長文やエージェントタスクのシナリオで特に有効であり、Qwen3.7-Maxは大規模なコードベースやドキュメントを頻繁に処理します。この動きは、最近キャッシュヒット課金を100万トークンあたり0.003625ドルに引き下げたDeepSeek V4-Proなどの競争的な価格圧力の中で行われました。これに対抗して、Qwen3.7-Maxはさらに低コストを実現する明示的なキャッシュモードも提供していますが、こちらは手動での設定が必要です。