비탈릭 부테린은 프라이버시와 보안에 중점을 둔 지역화된 개인 대형 언어 모델(LLM) 배포 계획을 제시했습니다. 이 이니셔티브는 원격 모델과 외부 서비스를 피함으로써 데이터 유출 및 무단 접근 위험을 최소화하는 것을 목표로 합니다. 주요 전략으로는 로컬 추론, 기기 내 파일 저장, 샌드박스 격리가 포함됩니다. 부테린의 하드웨어 테스트에는 NVIDIA 5090 GPU가 장착된 노트북, 128GB 통합 메모리를 가진 AMD Ryzen AI Max Pro 장치, 그리고 DGX Spark가 포함되었습니다. 성능 결과는 Qwen3.5 35B 모델을 사용한 5090 노트북이 초당 90 토큰을 처리했으며, AMD 장치와 DGX Spark는 각각 초당 51 및 60 토큰을 기록했습니다. 부테린은 로컬 AI 환경 구축을 위해 llama-server, llama-swap, NixOS와 같은 도구를 활용하며 고성능 노트북을 선호합니다.