Исследовательское подразделение ByteDance опубликовало с открытым исходным кодом Lance — мультимодальную модель с 3 миллиардами параметров, предназначенную для обработки изображений и видео. Обученная на 128 графических процессорах A100, модель Lance поддерживает одновременное понимание, генерацию и редактирование в рамках единой системы. В отличие от других моделей, которые увеличивают количество параметров, Lance использует архитектуру с двойным потоком Mixture-of-Experts и модально-ориентированное ротационное позиционное кодирование для повышения вычислительной эффективности и снижения помех сигнала.
Несмотря на легковесный дизайн, Lance демонстрирует высокие результаты в тестах на генерацию и редактирование изображений и видео, показывая экономичный подход к балансировке возможностей генерации и семантического понимания. Это развитие подчеркивает инновационную стратегию ByteDance в области мультимодального ИИ, предлагая решение с низкими вычислительными затратами при сохранении высокой производительности.
ByteDance открывает исходный код Lance — мультимодели с 3 миллиардами параметров
Отказ от ответственности: Контент, представленный на сайте Phemex News, предназначен исключительно для информационных целей.Мы не гарантируем качество, точность и полноту информации, полученной из статей третьих лиц.Содержание этой страницы не является финансовым или инвестиционным советом.Мы настоятельно рекомендуем вам провести собственное исследование и проконсультироваться с квалифицированным финансовым консультантом, прежде чем принимать какие-либо инвестиционные решения.
