알리바바의 Qwen 팀은 알리바바 클라우드의 바이리안 플랫폼에서 Qwen3.7-Max 모델을 위한 자동 암묵적 캐싱 기능을 출시하여 입력 비용을 최대 80%까지 크게 절감했습니다. 이 새로운 기능은 개발자가 코드 변경이나 매개변수 추가 없이도 비용 절감 혜택을 누릴 수 있도록 합니다. 시스템은 요청에서 반복되는 컨텍스트 접두사를 식별하여 일치하는 입력 토큰에 대해 표준 요금의 20%만 청구합니다.
암묵적 캐싱은 특히 긴 텍스트와 에이전트 작업 시나리오에서 유용하며, Qwen3.7-Max가 대규모 코드베이스나 문서를 자주 처리하는 경우에 효과적입니다. 이번 조치는 최근 캐시 적중 청구 비용을 백만 토큰당 0.003625달러로 대폭 인하한 DeepSeek V4-Pro의 경쟁적인 가격 압박 속에서 이루어졌습니다. 이에 대응하여 Qwen3.7-Max는 수동 구성이 필요하지만 더 낮은 비용을 제공하는 명시적 캐싱 모드도 제공합니다.
알리윤, Qwen3.7-Max에 암묵적 캐싱 도입으로 입력 비용 80% 절감
면책 조항: Phemex 뉴스에서 제공하는 콘텐츠는 정보 제공 목적으로만 제공됩니다. 제3자 기사에서 출처를 얻은 정보의 품질, 정확성 또는 완전성을 보장하지 않습니다.이 페이지의 콘텐츠는 재무 또는 투자 조언이 아닙니다.투자 결정을 내리기 전에 반드시 스스로 조사하고 자격을 갖춘 재무 전문가와 상담하시기 바랍니다.
