Baidu a lancé la version 3.5 de son outil OCR open source, PaddleOCR, introduisant des fonctionnalités nouvelles et significatives. La mise à jour inclut la sortie de PaddleOCR.js, un SDK d'inférence pour navigateur qui permet à PP-OCRv5 de fonctionner directement dans les navigateurs avec l'accélération WebGPU et Wasm, garantissant la confidentialité des données en les maintenant dans le navigateur. De plus, PaddleOCR prend désormais en charge la conversion en un clic des documents Word, Excel et PPT au format Markdown.
La mise à jour intègre également un backend Transformers, offrant l'accès à 20 modèles principaux via Hugging Face et permettant une commutation fluide entre les modes graphe statique, graphe dynamique et Transformers de PaddlePaddle. En outre, les résultats des séries PaddleOCR-VL, PP-StructureV3 et PP-DocTranslation peuvent désormais être exportés au format DOCX, améliorant ainsi les capacités de traitement des documents.
PaddleOCR 3.5 de Baidu fait ses débuts avec des fonctionnalités améliorées pour le navigateur et les documents
Avertissement : Le contenu proposé sur Phemex News est à titre informatif uniquement. Nous ne garantissons pas la qualité, l'exactitude ou l'exhaustivité des informations provenant d'articles tiers. Ce contenu ne constitue pas un conseil financier ou d'investissement. Nous vous recommandons vivement d'effectuer vos propres recherches et de consulter un conseiller financier qualifié avant toute décision d'investissement.
