DeepSeek, MIT lisansı altında Hugging Face ve ModelScope gibi platformlarda artık erişilebilir olan açık kaynaklı V4 serisi modellerinin önizleme sürümünü başlattı. V4 serisi, iki MoE modeli içeriyor: Yaklaşık 1,6 trilyon parametreye sahip ve token başına 49 milyar etkinleştirme yapan V4-Pro ile 284 milyar parametreye ve token başına 13 milyar etkinleştirme yapan V4-Flash. Her iki model de 1 milyon token'a kadar bağlam uzunluğunu destekliyor. Yeni modeller, önceki V3.2 sürümüne kıyasla uzun metinlerde akıl yürütme sırasında daha az bellek kullanımı ve hesaplama yükü vaat ediyor.
DeepSeek, 1,6 Trilyon Parametreli V4 Açık Kaynak Modellerini Tanıttı
Sorumluluk Reddi: Phemex Haberler'de sunulan içerik yalnızca bilgilendirme amaçlıdır. Üçüncü taraf makalelerden alınan bilgilerin kalitesi, doğruluğu veya eksiksizliğini garanti etmiyoruz. Bu sayfadaki içerik finansal veya yatırım tavsiyesi niteliği taşımaz. Yatırım kararları vermeden önce kendi araştırmanızı yapmanızı ve nitelikli bir finans danışmanına başvurmanızı şiddetle tavsiye ederiz.
