Компания Zhipu представила высокоскоростной API GLM-5.1, достигший прорывной скорости вывода в 400 токенов в секунду, что стало новым мировым эталоном для интерфейсов больших моделей. Этот высокоскоростной API, доступный для избранных корпоративных клиентов, работает на базе высокопроизводительного движка вывода, разработанного в сотрудничестве с командой TileRT. Движок оптимизирует планирование GPU, компилируя модели в постоянные ядра движка (Engine Kernels), что значительно снижает задержки.
В многопроцессорных средах TileRT повышает эффективность за счет специализации узлов GPU в топологии NVL с 8 GPU, улучшая вычисления слоев внимания и межпроцессорное взаимодействие. Компания Zhipu планирует дальнейшую оптимизацию вывода FP8 и расширение возможностей контекста для поддержки приложений с низкой задержкой, таких как программирование ИИ и взаимодействие в реальном времени.
Zhipu представила API GLM-5.1 с рекордной скоростью вывода 400 токенов/с
Отказ от ответственности: Контент, представленный на сайте Phemex News, предназначен исключительно для информационных целей.Мы не гарантируем качество, точность и полноту информации, полученной из статей третьих лиц.Содержание этой страницы не является финансовым или инвестиционным советом.Мы настоятельно рекомендуем вам провести собственное исследование и проконсультироваться с квалифицированным финансовым консультантом, прежде чем принимать какие-либо инвестиционные решения.
