El equipo Qwen de Alibaba ha lanzado un almacenamiento en caché implícito automático para su modelo Qwen3.7-Max en la plataforma Bailian de Alibaba Cloud, reduciendo significativamente los costos de entrada hasta en un 80%. Esta nueva función permite a los desarrolladores beneficiarse de ahorros en costos sin necesidad de modificar el código ni agregar parámetros. El sistema identifica prefijos de contexto repetidos en las solicitudes, cobrando solo el 20% de la tarifa estándar por los tokens de entrada coincidentes.
El almacenamiento en caché implícito es especialmente beneficioso para escenarios que involucran textos largos y tareas de agentes, donde Qwen3.7-Max procesa frecuentemente grandes bases de código o documentos. Esta iniciativa surge en medio de presiones competitivas en precios, especialmente por parte de DeepSeek V4-Pro, que recientemente redujo su tarifa por aciertos en caché a $0.003625 por millón de tokens. En respuesta, Qwen3.7-Max también ofrece un modo de almacenamiento en caché explícito, que proporciona costos aún más bajos pero requiere configuración manual.
Aliyun presenta almacenamiento en caché implícito para Qwen3.7-Max, reduciendo los costos de entrada en un 80%
Aviso legal: El contenido de Phemex News es únicamente informativo.No garantizamos la calidad, precisión ni integridad de la información procedente de artículos de terceros.El contenido de esta página no constituye asesoramiento financiero ni de inversión.Le recomendamos encarecidamente que realice su propia investigación y consulte con un asesor financiero cualificado antes de tomar cualquier decisión de inversión.
