Baidu выпустила версию 3.5 своего открытого OCR-инструмента PaddleOCR, представив значительные новые возможности. Обновление включает выпуск PaddleOCR.js — SDK для инференса в браузере, который позволяет запускать PP-OCRv5 непосредственно в браузерах с ускорением WebGPU и Wasm, обеспечивая конфиденциальность данных, так как они остаются внутри браузера. Кроме того, PaddleOCR теперь поддерживает однокликовое преобразование документов Word, Excel и PPT в формат Markdown. Обновление также интегрирует бэкенд Transformers, предоставляя доступ к 20 основным моделям через Hugging Face и обеспечивая плавное переключение между статическим графом, динамическим графом и режимами Transformers в PaddlePaddle. Более того, результаты из серии PaddleOCR-VL, PP-StructureV3 и PP-DocTranslation теперь можно экспортировать в формате DOCX, что улучшает возможности обработки документов.