Vitalik Buterin, gizlilik ve güvenliğe odaklanarak yerel, özel büyük dil modelleri (LLM'ler) dağıtmak için bir plan ortaya koydu. Bu girişim, uzak modellerden ve dış hizmetlerden kaçınarak veri sızıntısı ve yetkisiz erişim riskini en aza indirmeyi amaçlıyor. Temel stratejiler arasında yerel çıkarım, cihaz üzerinde dosya depolama ve sandbox izolasyonu bulunuyor. Buterin'in donanım testleri, NVIDIA 5090 GPU'lu bir dizüstü bilgisayar, 128 GB birleşik belleğe sahip AMD Ryzen AI Max Pro cihazı ve DGX Spark'ı içeriyordu. Performans sonuçları, 5090 dizüstü bilgisayarın Qwen3.5 35B modeli ile saniyede 90 token elde ettiğini gösterirken, AMD cihazı ve DGX Spark sırasıyla saniyede 51 ve 60 token hızına ulaştı. Buterin, yerel yapay zeka ortamları oluşturmak için llama-server, llama-swap ve NixOS gibi araçları kullanarak yüksek performanslı dizüstü bilgisayarları tercih ediyor.