百度は、オープンソースのOCRツールであるPaddleOCRのバージョン3.5をリリースし、重要な新機能を導入しました。このアップデートには、PaddleOCR.jsのリリースが含まれており、これはブラウザ推論SDKで、PP-OCRv5をWebGPUおよびWasmアクセラレーションを利用してブラウザ上で直接実行できるようにし、データプライバシーをブラウザ内に保持することを保証します。さらに、PaddleOCRはWord、Excel、PPTドキュメントをMarkdown形式にワンクリックで変換する機能もサポートしています。
このアップデートはまた、Transformersバックエンドを統合しており、Hugging Faceを通じて20の主要モデルにアクセスできるようにし、PaddlePaddleの静的グラフ、動的グラフ、およびTransformersモード間のシームレスな切り替えを可能にしています。さらに、PaddleOCR-VLシリーズ、PP-StructureV3、およびPP-DocTranslationの結果をDOCX形式でエクスポートできるようになり、ドキュメント処理能力が向上しています。
百度のPaddleOCR 3.5がブラウザとドキュメント機能を強化して登場
免責事項: Phemexニュースで提供されるコンテンツは、あくまで情報提供を目的としたものであり、第三者の記事から取得した情報の正確性・完全性・信頼性について保証するものではありません。本コンテンツは金融または投資の助言を目的としたものではなく、投資に関する最終判断はご自身での調査と、信頼できる専門家への相談を踏まえて行ってください。
