Исследовательская группа Tether по искусственному интеллекту выпустила открытую версию TurboQuant — алгоритма Google Research, направленного на значительное сокращение использования памяти в ИИ. Эта технология, теперь интегрированная в AI-движок QVAC Fabric от Tether, включает комплексный конвейер квантизации и профили развертывания для практического применения. TurboQuant решает проблему высокого потребления памяти в системах ИИ, позволяя им эффективно работать на локальных устройствах, таких как ноутбуки и телефоны, снижая требования к памяти до пяти раз при сохранении производительности. Генеральный директор Tether Паоло Ардоино подчеркнул важность этого развития, заявив, что TurboQuant позволяет инструментам ИИ обрабатывать большие объемы данных локально, улучшая их контекстуальное восприятие и снижая зависимость от облачной инфраструктуры. Этот прогресс поддерживает видение Tether по децентрализации рабочих нагрузок ИИ, способствуя увеличению длины контекстных окон и улучшению производительности на персональных устройствах и локальных сетях.