План локального приватного развертывания LLM Виталика Бутерина

Виталик Бутерин представил план развертывания локализованных, приватных больших языковых моделей (LLM) с акцентом на конфиденциальность и безопасность. Инициатива направлена на минимизацию риска утечки данных и несанкционированного доступа за счет отказа от удаленных моделей и внешних сервисов. Ключевые стратегии включают локальное инференс, хранение файлов на устройстве и изоляцию в песочнице. Тесты оборудования Бутерина включали ноутбук с графическим процессором NVIDIA 5090, устройство AMD Ryzen AI Max Pro с 128 ГБ объединенной памяти и DGX Spark. Результаты производительности показали, что ноутбук с 5090 достигал 90 токенов в секунду с моделью Qwen3.5 35B, в то время как устройство AMD и DGX Spark достигали 51 и 60 токенов в секунду соответственно. Бутерин предпочитает высокопроизводительные ноутбуки для создания локальных AI-сред, используя такие инструменты, как llama-server, llama-swap и NixOS.

Вам также может понравиться