Zyphra, AMD donanım ekosisteminde önemli bir ilerlemeyi temsil eden ZAYA1-8B-Diffusion-Preview adlı bir difüzyon dil modeli başlattı. Bu model, uzman karışımı (MoE) difüzyon modeli olup, otoregresif büyük bir dil modelinden türetilmiştir ve AMD çerçevesinde türünün ilk örneği olduğunu iddia etmektedir. Benzer modeller diğer ekipler tarafından tanıtılmış olsa da, ZAYA1 mühendislik verimliliğini artırmak için difüzyon mimarilerini kullanmasıyla kendini ayırmaktadır.
ZAYA1 modeli, ardışık token üretimi ve fiziksel hız sınırları nedeniyle kısıtlanan geleneksel otoregresif modellerin sınırlamalarını ele almaktadır. TiDAR yaklaşımını benimseyerek, ZAYA1 tek bir ileri geçişte 16 token adayının paralel olarak gürültüsünü azaltmayı mümkün kılarak, bellek bant genişliği kısıtlamalarını hesaplama darboğazlarına dönüştürür. Gerçek dünya testleri, ZAYA1'in özel CCA dikkat mekanizmasının, standart kayıpsız bir örnekleyici ile birleştiğinde, token alımında 4,6 kat hız artışı sağladığını göstermektedir. Bu hız artışı, karışık logit örnekleyici ile 7,7 kata çıkarak, gecikme yoğun büyük ölçekli çıkarım görevlerinde maliyetleri önemli ölçüde azaltmaktadır.
Zyphra, AMD Tabanlı Diffusion Dil Modelini 7,7 Kat Hız Artışıyla Tanıttı
Sorumluluk Reddi: Phemex Haberler'de sunulan içerik yalnızca bilgilendirme amaçlıdır. Üçüncü taraf makalelerden alınan bilgilerin kalitesi, doğruluğu veya eksiksizliğini garanti etmiyoruz. Bu sayfadaki içerik finansal veya yatırım tavsiyesi niteliği taşımaz. Yatırım kararları vermeden önce kendi araştırmanızı yapmanızı ve nitelikli bir finans danışmanına başvurmanızı şiddetle tavsiye ederiz.
