L'équipe de recherche en IA de Tether a publié une version prête pour la production de TurboQuant, une technologie de compression de mémoire développée par Google Research, intégrée dans le dernier SDK QVAC. TurboQuant réduit considérablement le problème de mise en cache clé-valeur, compressant le cache jusqu'à cinq fois avec un impact minimal sur la qualité de sortie. Cette avancée permet aux appareils grand public tels que les ordinateurs portables et les téléphones mobiles de gérer localement des tâches d'IA complexes, réduisant ainsi la dépendance aux centres de données cloud. Le PDG de Tether a souligné que cette mise à jour vise à faciliter le traitement de l'IA sur les appareils personnels et les réseaux locaux, s'éloignant des systèmes centralisés.