Китайский энтузиаст ИИ по имени APFrisco успешно запустил модель Kimi K2.5 от Moonshot AI с триллионом параметров на одной видеокарте Nvidia RTX 3060 в сочетании с 768 ГБ постоянной памяти Intel Optane. Несмотря на использование видеокарты среднего уровня, установка достигла примерно четырёх токенов в секунду, демонстрируя потенциал нестандартных аппаратных конфигураций.
Kimi K2.5 — это модель типа Mixture-of-Experts, которая активирует только 32 миллиарда параметров на токен, что позволяет запускать её на потребительском оборудовании. Полный размер модели составляет около 630 ГБ, а квантизированные версии — 381 ГБ, что требует использования памяти Optane из-за её экономической эффективности по сравнению с традиционной DRAM. Эта демонстрация подчёркивает доступность передовых моделей ИИ, поскольку Kimi K2.5 имеет открытые веса, что позволяет энтузиастам экспериментировать с масштабными ИИ без корпоративной инфраструктуры.
Энтузиаст ИИ запускает модель с 1 триллионом параметров на RTX 3060 с памятью Optane
Отказ от ответственности: Контент, представленный на сайте Phemex News, предназначен исключительно для информационных целей.Мы не гарантируем качество, точность и полноту информации, полученной из статей третьих лиц.Содержание этой страницы не является финансовым или инвестиционным советом.Мы настоятельно рекомендуем вам провести собственное исследование и проконсультироваться с квалифицированным финансовым консультантом, прежде чем принимать какие-либо инвестиционные решения.
