Sakana AIは東京大学と協力し、大規模モデルのトレーニングにおけるGPUメモリ使用量を削減することを目的とした新しいトレーニングフレームワーク「DiffusionBlocks」を発表しました。ICLR 2026で発表されたDiffusionBlocksは、ニューラルネットワークをモジュールに分割し、それぞれのモジュールを独立してトレーニングできるようにします。このアプローチにより、ブロック単位の更新が可能となり、VRAMの消費を大幅に削減し、元の必要量の1/Bにまでメモリ使用量を減らすことができます。
このフレームワークは、深層モデルにおけるVRAMの要求に対処するため、更新時に一度に1つのブロックのみを読み込み、サンプリングされていないブロックは読み込まない仕組みを採用しています。実験では、この方法がVRAMの必要量を減らすだけでなく、視覚的トランスフォーマーやテキスト生成などのタスクにおいて従来のトレーニング性能と同等かそれ以上の成果を示すことが確認されています。さらに、DiffusionBlocksは動的な収束プロセスをシミュレートすることで再帰モデルの最適化にも寄与し、トレーニング時の計算コストを削減します。
Sakana AI、GPUメモリ使用量を大幅削減するDiffusionBlocksを発表
免責事項: Phemexニュースで提供されるコンテンツは、あくまで情報提供を目的としたものであり、第三者の記事から取得した情報の正確性・完全性・信頼性について保証するものではありません。本コンテンツは金融または投資の助言を目的としたものではなく、投資に関する最終判断はご自身での調査と、信頼できる専門家への相談を踏まえて行ってください。
