Perceptron AI представила свою флагманскую мультимодальную модель Mk1, разработанную для понимания видео и воплощённого рассуждения. Основанная бывшими исследователями Meta FAIR Арменом Агаджаняном и Акшатом Шриваставой, команда из 14 человек стремится конкурировать с такими гигантами индустрии, как Google и OpenAI, предлагая Mk1 по более низкой цене. Модель превосходна в временном анализе видео, способна создавать структурированные хронологические анализы и обнаруживать конкретные события в видео.
Возможности Mk1 распространяются на обработку изображений, поддерживая указание на уровне пикселей, плотный подсчёт объектов и сложное оптическое распознавание символов (OCR). Она может преобразовывать документы в HTML, JSON или Markdown, что делает её подходящей для промышленных применений, таких как оцифровка панелей управления. Для робототехники Mk1 выдаёт пространственные примитивы для моделей управления и может аннотировать видео с телеуправлением, снижая необходимость ручной разметки. Модель доступна через Perceptron API и OpenRouter.
Perceptron AI запускает модель Mk1, бросая вызов Google и OpenAI
Отказ от ответственности: Контент, представленный на сайте Phemex News, предназначен исключительно для информационных целей.Мы не гарантируем качество, точность и полноту информации, полученной из статей третьих лиц.Содержание этой страницы не является финансовым или инвестиционным советом.Мы настоятельно рекомендуем вам провести собственное исследование и проконсультироваться с квалифицированным финансовым консультантом, прежде чем принимать какие-либо инвестиционные решения.
