Baidu a lancé la version 3.5 de son outil OCR open source, PaddleOCR, introduisant des fonctionnalités nouvelles et significatives. La mise à jour inclut la sortie de PaddleOCR.js, un SDK d'inférence pour navigateur qui permet à PP-OCRv5 de fonctionner directement dans les navigateurs avec l'accélération WebGPU et Wasm, garantissant la confidentialité des données en les maintenant dans le navigateur. De plus, PaddleOCR prend désormais en charge la conversion en un clic des documents Word, Excel et PPT au format Markdown. La mise à jour intègre également un backend Transformers, offrant l'accès à 20 modèles principaux via Hugging Face et permettant une commutation fluide entre les modes graphe statique, graphe dynamique et Transformers de PaddlePaddle. En outre, les résultats des séries PaddleOCR-VL, PP-StructureV3 et PP-DocTranslation peuvent désormais être exportés au format DOCX, améliorant ainsi les capacités de traitement des documents.