DeepSeek выпустила предварительную версию своей серии открытых моделей V4, теперь доступных под лицензией MIT на таких платформах, как Hugging Face и ModelScope. Серия V4 включает две модели MoE: V4-Pro с примерно 1,6 триллиона параметров и 49 миллиардами активированных на токен, и V4-Flash с 284 миллиардами параметров и 13 миллиардами активированных на токен. Обе модели поддерживают длину контекста до 1 миллиона токенов. Новые модели обещают снизить использование памяти и вычислительную нагрузку при обработке длинных текстов по сравнению с предыдущей версией V3.2.
DeepSeek представляет открытые модели V4 с 1,6 триллиона параметров
Отказ от ответственности: Контент, представленный на сайте Phemex News, предназначен исключительно для информационных целей.Мы не гарантируем качество, точность и полноту информации, полученной из статей третьих лиц.Содержание этой страницы не является финансовым или инвестиционным советом.Мы настоятельно рекомендуем вам провести собственное исследование и проконсультироваться с квалифицированным финансовым консультантом, прежде чем принимать какие-либо инвестиционные решения.
