Firecrawlは、Rustで書き直された新しいPDF解析エンジン「Fire-PDF」を導入し、PDFを構造化されたMarkdownに変換する速度を大幅に向上させました。この新エンジンは、前世代のエンジンに比べて3.5倍から5.7倍の速度向上を実現し、1ページあたりの平均処理時間は400ミリ秒未満です。この性能向上はGPU呼び出しの削減によるものです。
また、FirecrawlはRust製のライブラリ「pdf-inspector」をオープンソース化しました。これはPDFページを効率的に分類します。純粋なテキストページはGPUを使用せずに処理され、スキャンされたページや画像が多いページはニューラルネットワークモデルを利用します。Fire-PDFは異なるコンテンツタイプに応じて特定のパラメータを適用し、表、数式、多段組レイアウトの精度を確保します。この新エンジンは追加の設定なしにすべてのFirecrawlユーザーに自動的に提供されます。
Firecrawl、RustベースのPDFパーサーを発表し、速度を最大5.7倍向上
免責事項: Phemexニュースで提供されるコンテンツは、あくまで情報提供を目的としたものであり、第三者の記事から取得した情報の正確性・完全性・信頼性について保証するものではありません。本コンテンツは金融または投資の助言を目的としたものではなく、投資に関する最終判断はご自身での調査と、信頼できる専門家への相談を踏まえて行ってください。
