Команда Qwen компании Alibaba запустила автоматическое неявное кэширование для модели Qwen3.7-Max на платформе Bailian облака Alibaba, что значительно снижает затраты на ввод данных до 80%. Эта новая функция позволяет разработчикам экономить средства без необходимости изменять код или добавлять параметры. Система выявляет повторяющиеся префиксы контекста в запросах и взимает плату только в размере 20% от стандартной ставки за совпадающие входные токены.
Неявное кэширование особенно полезно в сценариях с длинными текстами и задачами агентов, где Qwen3.7-Max часто обрабатывает большие кодовые базы или документы. Этот шаг происходит на фоне конкурентного ценового давления, в частности со стороны DeepSeek V4-Pro, который недавно снизил стоимость кэширования до $0,003625 за миллион токенов. В ответ Qwen3.7-Max также предлагает режим явного кэширования, обеспечивающий еще более низкие затраты, но требующий ручной настройки.
Aliyun внедряет неявное кэширование для Qwen3.7-Max, сокращая затраты на ввод на 80%
Отказ от ответственности: Контент, представленный на сайте Phemex News, предназначен исключительно для информационных целей.Мы не гарантируем качество, точность и полноту информации, полученной из статей третьих лиц.Содержание этой страницы не является финансовым или инвестиционным советом.Мы настоятельно рекомендуем вам провести собственное исследование и проконсультироваться с квалифицированным финансовым консультантом, прежде чем принимать какие-либо инвестиционные решения.
