Китайский энтузиаст ИИ по имени APFrisco успешно запустил модель Kimi K2.5 от Moonshot AI с триллионом параметров на одной видеокарте Nvidia RTX 3060 в сочетании с 768 ГБ постоянной памяти Intel Optane. Несмотря на использование видеокарты среднего уровня, установка достигла примерно четырёх токенов в секунду, демонстрируя потенциал нестандартных аппаратных конфигураций. Kimi K2.5 — это модель типа Mixture-of-Experts, которая активирует только 32 миллиарда параметров на токен, что позволяет запускать её на потребительском оборудовании. Полный размер модели составляет около 630 ГБ, а квантизированные версии — 381 ГБ, что требует использования памяти Optane из-за её экономической эффективности по сравнению с традиционной DRAM. Эта демонстрация подчёркивает доступность передовых моделей ИИ, поскольку Kimi K2.5 имеет открытые веса, что позволяет энтузиастам экспериментировать с масштабными ИИ без корпоративной инфраструктуры.