바이두는 오픈소스 OCR 도구인 PaddleOCR의 버전 3.5를 출시하며 중요한 새로운 기능들을 도입했습니다. 이번 업데이트에는 PaddleOCR.js의 출시가 포함되어 있는데, 이는 WebGPU와 Wasm 가속을 통해 PP-OCRv5가 브라우저 내에서 직접 실행될 수 있도록 하는 브라우저 추론 SDK로, 데이터를 브라우저 내에 유지하여 개인정보 보호를 보장합니다. 또한 PaddleOCR는 이제 Word, Excel, PPT 문서를 원클릭으로 Markdown 형식으로 변환하는 기능을 지원합니다.
이번 업데이트는 또한 Transformers 백엔드를 통합하여 Hugging Face를 통해 20개의 주요 모델에 접근할 수 있게 하며, PaddlePaddle의 정적 그래프, 동적 그래프, Transformers 모드 간의 원활한 전환을 가능하게 합니다. 더불어 PaddleOCR-VL 시리즈, PP-StructureV3, PP-DocTranslation의 결과물을 DOCX 형식으로 내보낼 수 있어 문서 처리 능력이 향상되었습니다.
바이두의 PaddleOCR 3.5, 향상된 브라우저 및 문서 기능과 함께 출시
면책 조항: Phemex 뉴스에서 제공하는 콘텐츠는 정보 제공 목적으로만 제공됩니다. 제3자 기사에서 출처를 얻은 정보의 품질, 정확성 또는 완전성을 보장하지 않습니다.이 페이지의 콘텐츠는 재무 또는 투자 조언이 아닙니다.투자 결정을 내리기 전에 반드시 스스로 조사하고 자격을 갖춘 재무 전문가와 상담하시기 바랍니다.
