Firecrawl hat Fire-PDF vorgestellt, eine neue PDF-Parsing-Engine, die in Rust neu geschrieben wurde und die Geschwindigkeit der Umwandlung von PDFs in strukturiertes Markdown erheblich verbessert. Die neue Engine erreicht eine Geschwindigkeitssteigerung von 3,5 bis 5,7 Mal gegenüber ihrem Vorgänger, mit einer durchschnittlichen Verarbeitungszeit von unter 400 Millisekunden pro Seite. Dieser Leistungsschub wird auf reduzierte GPU-Aufrufe zurückgeführt. Firecrawl hat außerdem die Rust-Bibliothek pdf-inspector als Open Source veröffentlicht, die PDF-Seiten effizient klassifiziert. Reine Textseiten werden ohne GPU-Nutzung verarbeitet, während gescannte oder bildlastige Seiten neuronale Netzmodelle verwenden. Fire-PDF wendet spezifische Parameter für verschiedene Inhaltstypen an und gewährleistet so Genauigkeit bei Tabellen, Formeln und mehrspaltigen Layouts. Die neue Engine steht allen Firecrawl-Nutzern automatisch ohne zusätzliche Konfiguration zur Verfügung.