A Baidu lançou a versão 3.5 de sua ferramenta OCR de código aberto, PaddleOCR, introduzindo capacidades significativas. A atualização inclui o lançamento do PaddleOCR.js, um SDK de inferência para navegadores que permite que o PP-OCRv5 seja executado diretamente nos navegadores com aceleração WebGPU e Wasm, garantindo a privacidade dos dados ao mantê-los dentro do navegador. Além disso, o PaddleOCR agora suporta a conversão com um clique de documentos Word, Excel e PPT para o formato Markdown. A atualização também integra um backend Transformers, proporcionando acesso a 20 modelos principais via Hugging Face e permitindo a troca fluida entre os modos de gráfico estático, gráfico dinâmico e Transformers do PaddlePaddle. Além disso, os resultados das séries PaddleOCR-VL, PP-StructureV3 e PP-DocTranslation agora podem ser exportados no formato DOCX, aprimorando as capacidades de processamento de documentos.