A Baidu lançou a versão 3.5 de sua ferramenta OCR de código aberto, PaddleOCR, introduzindo capacidades significativas. A atualização inclui o lançamento do PaddleOCR.js, um SDK de inferência para navegadores que permite que o PP-OCRv5 seja executado diretamente nos navegadores com aceleração WebGPU e Wasm, garantindo a privacidade dos dados ao mantê-los dentro do navegador. Além disso, o PaddleOCR agora suporta a conversão com um clique de documentos Word, Excel e PPT para o formato Markdown.
A atualização também integra um backend Transformers, proporcionando acesso a 20 modelos principais via Hugging Face e permitindo a troca fluida entre os modos de gráfico estático, gráfico dinâmico e Transformers do PaddlePaddle. Além disso, os resultados das séries PaddleOCR-VL, PP-StructureV3 e PP-DocTranslation agora podem ser exportados no formato DOCX, aprimorando as capacidades de processamento de documentos.
PaddleOCR 3.5 da Baidu estreia com recursos aprimorados para navegador e documentos
Aviso Legal: O conteúdo disponibilizado no Phemex News é apenas para fins informativos. Não garantimos a qualidade, precisão ou integridade das informações provenientes de artigos de terceiros. Este conteúdo não constitui aconselhamento financeiro ou de investimento. Recomendamos fortemente que você realize suas próprias pesquisas e consulte um consultor financeiro qualificado antes de tomar decisões de investimento.
