Adobe, 10 Kat Daha Hızlı RAEv2'yi Açık Kaynak Yaptı

Adobe Research, Avustralya Ulusal Üniversitesi ve New York Üniversitesi iş birliğiyle, ikinci nesil Temsil Otokodlayıcı RAEv2'yi açık kaynak yaptı. Xie Saining liderliğindeki bu yeni model, düşük yeniden yapılandırma kalitesi ve yavaş yakınsama gibi temel sınırlamaları ele alarak selefine kıyasla önemli iyileştirmeler sunuyor. Geleneksel Varyasyonel Otokodlayıcılara alternatif olarak difüzyon modeli tabanlı RAEv2, ImageNet üzerinde sadece 80 eğitim adımında 1.06 global FID değeri elde ederek yakınsama hızında on kat artış sağladı. RAEv2 mimarisi, yeniden yapılandırma kalitesini ve sıkıştırma verimliliğini artıran çok katmanlı temsil yaklaşımı da dahil olmak üzere üç temel optimizasyon sunuyor. Ayrıca model, mekânsal detay yakalamayı geliştirmek için Temsil Hizalaması (REPA) entegre ederek DINOv3 gibi güçlü kodlayıcıların üretken görevlerde üstün performans göstermesine olanak tanıyor. Yeni mimari, difüzyon modelinin çıktısını da yeniden düzenleyerek ek eğitim maliyeti olmadan "ücretsiz" iç rehberlik sağlıyor. RAEv2, çeşitli metriklerde önceki modelleri geride bırakıyor ve metinden görüntü üretimi ile video sentezi gibi görevlerde güçlü genelleme yeteneği gösteriyor.

​​Beğenebileceğiniz Diğer İçerikler​​

Beğenebileceğiniz Diğer İçerikler