Vitalik Buterin delineou um plano para implantar modelos de linguagem grandes (LLMs) localizados e privados, com foco em privacidade e segurança. A iniciativa visa minimizar o risco de vazamento de dados e acesso não autorizado, evitando modelos remotos e serviços externos. As estratégias principais incluem inferência local, armazenamento de arquivos no dispositivo e isolamento em sandbox. Os testes de hardware de Buterin envolveram um laptop com GPU NVIDIA 5090, um dispositivo AMD Ryzen AI Max Pro com 128 GB de memória unificada e o DGX Spark. Os resultados de desempenho mostraram que o laptop 5090 alcançou 90 tokens por segundo com o modelo Qwen3.5 35B, enquanto o dispositivo AMD e o DGX Spark atingiram 51 e 60 tokens por segundo, respectivamente. Buterin prefere laptops de alto desempenho para construir ambientes locais de IA, utilizando ferramentas como llama-server, llama-swap e NixOS.