Qwen3.7-Max da Aliyun reduz custos em 80% com C Implícito

A equipe Qwen da Alibaba lançou o cache implícito automático para seu modelo Qwen3.7-Max na plataforma Bailian da Alibaba Cloud, reduzindo significativamente os custos de entrada em até 80%. Esse novo recurso permite que os desenvolvedores se beneficiem de economias sem alterar o código ou adicionar parâmetros. O sistema identifica prefixos de contexto repetidos nas solicitações, cobrando apenas 20% da taxa padrão para os tokens de entrada correspondentes. O cache implícito é particularmente benéfico para cenários que envolvem textos longos e tarefas de Agente, onde o Qwen3.7-Max frequentemente processa grandes bases de código ou documentos. Essa iniciativa ocorre em meio a pressões competitivas de preços, notadamente do DeepSeek V4-Pro, que recentemente reduziu sua cobrança por acerto de cache para US$ 0,003625 por milhão de tokens. Em resposta, o Qwen3.7-Max também oferece um modo de cache explícito, proporcionando custos ainda menores, mas exigindo configuração manual.