Baidu ha lanzado la versión 3.5 de su herramienta OCR de código abierto, PaddleOCR, introduciendo capacidades nuevas y significativas. La actualización incluye el lanzamiento de PaddleOCR.js, un SDK de inferencia para navegadores que permite que PP-OCRv5 funcione directamente en los navegadores con aceleración WebGPU y Wasm, garantizando la privacidad de los datos al mantenerlos dentro del navegador. Además, PaddleOCR ahora soporta la conversión con un solo clic de documentos Word, Excel y PPT a formato Markdown. La actualización también integra un backend de Transformers, proporcionando acceso a 20 modelos principales a través de Hugging Face y permitiendo un cambio fluido entre los modos de gráfico estático, gráfico dinámico y Transformers de PaddlePaddle. Además, los resultados de la serie PaddleOCR-VL, PP-StructureV3 y PP-DocTranslation ahora pueden exportarse en formato DOCX, mejorando las capacidades de procesamiento de documentos.