알리바바의 Qwen 팀은 알리바바 클라우드의 바이리안 플랫폼에서 Qwen3.7-Max 모델을 위한 자동 암묵적 캐싱 기능을 출시하여 입력 비용을 최대 80%까지 크게 절감했습니다. 이 새로운 기능은 개발자가 코드 변경이나 매개변수 추가 없이도 비용 절감 혜택을 누릴 수 있도록 합니다. 시스템은 요청에서 반복되는 컨텍스트 접두사를 식별하여 일치하는 입력 토큰에 대해 표준 요금의 20%만 청구합니다. 암묵적 캐싱은 특히 긴 텍스트와 에이전트 작업 시나리오에서 유용하며, Qwen3.7-Max가 대규모 코드베이스나 문서를 자주 처리하는 경우에 효과적입니다. 이번 조치는 최근 캐시 적중 청구 비용을 백만 토큰당 0.003625달러로 대폭 인하한 DeepSeek V4-Pro의 경쟁적인 가격 압박 속에서 이루어졌습니다. 이에 대응하여 Qwen3.7-Max는 수동 구성이 필요하지만 더 낮은 비용을 제공하는 명시적 캐싱 모드도 제공합니다.