Qwen3.7-Max от Aliyun снижает затраты на 80%

Команда Qwen компании Alibaba запустила автоматическое неявное кэширование для модели Qwen3.7-Max на платформе Bailian облака Alibaba, что значительно снижает затраты на ввод данных до 80%. Эта новая функция позволяет разработчикам экономить средства без необходимости изменять код или добавлять параметры. Система выявляет повторяющиеся префиксы контекста в запросах и взимает плату только в размере 20% от стандартной ставки за совпадающие входные токены. Неявное кэширование особенно полезно в сценариях с длинными текстами и задачами агентов, где Qwen3.7-Max часто обрабатывает большие кодовые базы или документы. Этот шаг происходит на фоне конкурентного ценового давления, в частности со стороны DeepSeek V4-Pro, который недавно снизил стоимость кэширования до $0,003625 за миллион токенов. В ответ Qwen3.7-Max также предлагает режим явного кэширования, обеспечивающий еще более низкие затраты, но требующий ручной настройки.