바이두는 오픈소스 OCR 도구인 PaddleOCR의 버전 3.5를 출시하며 중요한 새로운 기능들을 도입했습니다. 이번 업데이트에는 PaddleOCR.js의 출시가 포함되어 있는데, 이는 WebGPU와 Wasm 가속을 통해 PP-OCRv5가 브라우저 내에서 직접 실행될 수 있도록 하는 브라우저 추론 SDK로, 데이터를 브라우저 내에 유지하여 개인정보 보호를 보장합니다. 또한 PaddleOCR는 이제 Word, Excel, PPT 문서를 원클릭으로 Markdown 형식으로 변환하는 기능을 지원합니다. 이번 업데이트는 또한 Transformers 백엔드를 통합하여 Hugging Face를 통해 20개의 주요 모델에 접근할 수 있게 하며, PaddlePaddle의 정적 그래프, 동적 그래프, Transformers 모드 간의 원활한 전환을 가능하게 합니다. 더불어 PaddleOCR-VL 시리즈, PP-StructureV3, PP-DocTranslation의 결과물을 DOCX 형식으로 내보낼 수 있어 문서 처리 능력이 향상되었습니다.