A equipe de pesquisa em IA da Tether lançou uma versão pronta para produção do TurboQuant, uma tecnologia de compressão de memória desenvolvida pelo Google Research, integrada ao mais recente SDK QVAC. O TurboQuant reduz significativamente o problema de cache de chave-valor, comprimindo o cache em até cinco vezes com impacto mínimo na qualidade da saída. Esse avanço permite que dispositivos de consumo, como laptops e telefones móveis, realizem tarefas complexas de IA localmente, reduzindo a dependência de data centers na nuvem. O CEO da Tether enfatizou que essa atualização visa facilitar o processamento de IA em dispositivos pessoais e redes locais, afastando-se dos sistemas centralizados.