Sakana AI는 도쿄 대학과 협력하여 대규모 모델 훈련 시 GPU 메모리 사용량을 줄이기 위한 새로운 훈련 프레임워크인 DiffusionBlocks를 출시했습니다. 2026년 ICLR에서 발표된 DiffusionBlocks는 신경망을 모듈로 나누어 각 모듈을 독립적으로 훈련할 수 있게 합니다. 이 접근법은 블록 단위 업데이트를 가능하게 하여 VRAM 소비를 크게 줄이고, 메모리 사용량을 원래 요구량의 1/B로 감소시킵니다.
이 프레임워크는 깊은 모델에서 VRAM 요구 문제를 해결하기 위해 한 번에 하나의 블록만 로드하여 업데이트하고, 샘플링되지 않은 블록은 로드하지 않습니다. 실험 결과 이 방법은 VRAM 필요량을 줄일 뿐만 아니라 시각적 트랜스포머 및 텍스트 생성과 같은 작업에서 전통적인 훈련 성능과 동등하거나 더 뛰어난 성능을 보였습니다. 또한 DiffusionBlocks는 동적 수렴 과정을 시뮬레이션하여 순환 모델의 최적화 이점을 제공하며, 훈련 중 계산 비용을 줄입니다.
사카나 AI, GPU 메모리 사용량 대폭 감소시키는 DiffusionBlocks 공개
면책 조항: Phemex 뉴스에서 제공하는 콘텐츠는 정보 제공 목적으로만 제공됩니다. 제3자 기사에서 출처를 얻은 정보의 품질, 정확성 또는 완전성을 보장하지 않습니다.이 페이지의 콘텐츠는 재무 또는 투자 조언이 아닙니다.투자 결정을 내리기 전에 반드시 스스로 조사하고 자격을 갖춘 재무 전문가와 상담하시기 바랍니다.
