Firecrawl đã giới thiệu Fire-PDF, một công cụ phân tích PDF mới được viết lại bằng Rust, cải thiện đáng kể tốc độ chuyển đổi các tệp PDF thành Markdown có cấu trúc. Công cụ mới này đạt được tốc độ nhanh hơn từ 3,5 đến 5,7 lần so với phiên bản trước, với thời gian xử lý trung bình dưới 400 mili giây mỗi trang. Sự cải thiện hiệu suất này được cho là nhờ giảm số lần gọi GPU. Firecrawl cũng đã mở mã nguồn thư viện Rust pdf-inspector, giúp phân loại các trang PDF một cách hiệu quả. Các trang chỉ chứa văn bản thuần được xử lý mà không sử dụng GPU, trong khi các trang quét hoặc chứa nhiều hình ảnh sử dụng các mô hình mạng nơ-ron. Fire-PDF áp dụng các tham số cụ thể cho từng loại nội dung khác nhau, đảm bảo độ chính xác trong bảng biểu, công thức và bố cục nhiều cột. Công cụ mới này tự động có sẵn cho tất cả người dùng Firecrawl mà không cần cấu hình thêm.