테더는 QVAC 패브릭 내에서 크로스 플랫폼 BitNet LoRA 미세 조정 프레임워크를 도입하여 마이크로소프트 BitNet(1비트 LLM) 모델의 학습 및 추론을 최적화하도록 설계했습니다. 이 혁신은 노트북, 소비자용 GPU, 스마트폰과 같은 소비자 기기에서 수십억 매개변수 모델의 학습 및 미세 조정을 가능하게 합니다. 특히 Adreno, Mali, Apple Bionic을 포함한 모바일 GPU에서 BitNet 모델을 미세 조정할 수 있게 하여 모바일 AI 기능에서 중요한 진전을 이루었습니다. 이 프레임워크는 인텔, AMD, 애플 실리콘 등 이기종 하드웨어를 지원하며, 비 NVIDIA 장치에서 1비트 LLM LoRA 미세 조정을 가능하게 한 최초의 기술입니다. 성능 테스트 결과 모바일 GPU에서의 BitNet 모델 추론 속도가 CPU보다 2배에서 11배 빠르며, VRAM 사용량은 기존 16비트 모델 대비 최대 77.8%까지 감소했습니다. 테더는 이 기술이 고성능 컴퓨팅 파워와 클라우드 인프라에 대한 의존도를 줄이고 AI 학습의 분산화와 지역화를 촉진할 수 있다고 강조했습니다.