ByteDance Araştırma, görüntü ve video işleme için tasarlanmış 3 milyar parametreli çok modlu modeli Lance'i açık kaynak yaptı. 128 A100 GPU üzerinde eğitilen Lance, tek bir çerçevede eşzamanlı anlama, üretim ve düzenlemeyi destekliyor. Parametre boyutunu artıran diğer modellerin aksine, Lance hesaplama verimliliğini yönetmek ve sinyal paraztını azaltmak için çift akışlı Uzman Karışımı mimarisi ve modal farkındalıklı döner konumsal kodlama kullanıyor. Hafif tasarımına rağmen, Lance görüntü ve video üretimi ile düzenlemede kıyaslama testlerinde üstün performans göstererek üretim yeteneği ile anlamsal anlayışı dengeleyen maliyet etkin bir yaklaşım sunuyor. Bu gelişme, ByteDance'in çok modlu yapay zekadaki yenilikçi stratejisini vurgulayarak, yüksek performansı koruyan düşük hesaplama gerektiren bir çözüm sunuyor.