Baidu выпустила версию 3.5 своего открытого OCR-инструмента PaddleOCR, представив значительные новые возможности. Обновление включает выпуск PaddleOCR.js — SDK для инференса в браузере, который позволяет запускать PP-OCRv5 непосредственно в браузерах с ускорением WebGPU и Wasm, обеспечивая конфиденциальность данных, так как они остаются внутри браузера. Кроме того, PaddleOCR теперь поддерживает однокликовое преобразование документов Word, Excel и PPT в формат Markdown.
Обновление также интегрирует бэкенд Transformers, предоставляя доступ к 20 основным моделям через Hugging Face и обеспечивая плавное переключение между статическим графом, динамическим графом и режимами Transformers в PaddlePaddle. Более того, результаты из серии PaddleOCR-VL, PP-StructureV3 и PP-DocTranslation теперь можно экспортировать в формате DOCX, что улучшает возможности обработки документов.
PaddleOCR 3.5 от Baidu дебютирует с улучшенными функциями для браузера и документов
Отказ от ответственности: Контент, представленный на сайте Phemex News, предназначен исключительно для информационных целей.Мы не гарантируем качество, точность и полноту информации, полученной из статей третьих лиц.Содержание этой страницы не является финансовым или инвестиционным советом.Мы настоятельно рекомендуем вам провести собственное исследование и проконсультироваться с квалифицированным финансовым консультантом, прежде чем принимать какие-либо инвестиционные решения.
