Sakana AI в сотрудничестве с Токийским университетом представила DiffusionBlocks — новую систему обучения, направленную на снижение использования памяти GPU при обучении больших моделей. Объявленная на конференции ICLR 2026, DiffusionBlocks разделяет нейронные сети на модули, позволяя независимо обучать каждый из них. Такой подход значительно сокращает потребление видеопамяти (VRAM) за счёт обновлений по блокам, уменьшая использование памяти до одной B-й части от первоначальной потребности.
Данная система решает проблему высоких требований к VRAM в глубоких моделях, загружая для обновления только один блок за раз, при этом неиспользуемые блоки остаются выгруженными. Эксперименты показывают, что этот метод не только снижает потребность в VRAM, но и соответствует или превосходит традиционные методы обучения в задачах, таких как визуальные трансформеры и генерация текста. Кроме того, DiffusionBlocks предоставляет преимущества оптимизации для рекуррентных моделей, имитируя динамический процесс сходимости и снижая вычислительные затраты во время обучения.
Sakana AI представляет DiffusionBlocks для сокращения использования памяти GPU
Отказ от ответственности: Контент, представленный на сайте Phemex News, предназначен исключительно для информационных целей.Мы не гарантируем качество, точность и полноту информации, полученной из статей третьих лиц.Содержание этой страницы не является финансовым или инвестиционным советом.Мы настоятельно рекомендуем вам провести собственное исследование и проконсультироваться с квалифицированным финансовым консультантом, прежде чем принимать какие-либо инвестиционные решения.
