Baidu ha lanzado la versión 3.5 de su herramienta OCR de código abierto, PaddleOCR, introduciendo capacidades nuevas y significativas. La actualización incluye el lanzamiento de PaddleOCR.js, un SDK de inferencia para navegadores que permite que PP-OCRv5 funcione directamente en los navegadores con aceleración WebGPU y Wasm, garantizando la privacidad de los datos al mantenerlos dentro del navegador. Además, PaddleOCR ahora soporta la conversión con un solo clic de documentos Word, Excel y PPT a formato Markdown.
La actualización también integra un backend de Transformers, proporcionando acceso a 20 modelos principales a través de Hugging Face y permitiendo un cambio fluido entre los modos de gráfico estático, gráfico dinámico y Transformers de PaddlePaddle. Además, los resultados de la serie PaddleOCR-VL, PP-StructureV3 y PP-DocTranslation ahora pueden exportarse en formato DOCX, mejorando las capacidades de procesamiento de documentos.
PaddleOCR 3.5 de Baidu se lanza con funciones mejoradas para navegador y documentos
Aviso legal: El contenido de Phemex News es únicamente informativo.No garantizamos la calidad, precisión ni integridad de la información procedente de artículos de terceros.El contenido de esta página no constituye asesoramiento financiero ni de inversión.Le recomendamos encarecidamente que realice su propia investigación y consulte con un asesor financiero cualificado antes de tomar cualquier decisión de inversión.
