El equipo Qwen de Alibaba ha lanzado un almacenamiento en caché implícito automático para su modelo Qwen3.7-Max en la plataforma Bailian de Alibaba Cloud, reduciendo significativamente los costos de entrada hasta en un 80%. Esta nueva función permite a los desarrolladores beneficiarse de ahorros en costos sin necesidad de modificar el código ni agregar parámetros. El sistema identifica prefijos de contexto repetidos en las solicitudes, cobrando solo el 20% de la tarifa estándar por los tokens de entrada coincidentes. El almacenamiento en caché implícito es especialmente beneficioso para escenarios que involucran textos largos y tareas de agentes, donde Qwen3.7-Max procesa frecuentemente grandes bases de código o documentos. Esta iniciativa surge en medio de presiones competitivas en precios, especialmente por parte de DeepSeek V4-Pro, que recientemente redujo su tarifa por aciertos en caché a $0.003625 por millón de tokens. En respuesta, Qwen3.7-Max también ofrece un modo de almacenamiento en caché explícito, que proporciona costos aún más bajos pero requiere configuración manual.