Firecrawl представила Fire-PDF, новый движок для парсинга PDF, переписанный на Rust, что значительно ускоряет преобразование PDF в структурированный Markdown. Новый движок обеспечивает увеличение скорости в 3,5–5,7 раза по сравнению с предыдущей версией, при этом среднее время обработки составляет менее 400 миллисекунд на страницу. Этот прирост производительности достигается за счёт уменьшения количества вызовов GPU. Firecrawl также открыла исходный код библиотеки на Rust под названием pdf-inspector, которая эффективно классифицирует страницы PDF. Страницы с чистым текстом обрабатываются без использования GPU, тогда как отсканированные или насыщенные изображениями страницы обрабатываются с помощью моделей нейронных сетей. Fire-PDF применяет специальные параметры для разных типов контента, обеспечивая точность при работе с таблицами, формулами и много колонными макетами. Новый движок автоматически доступен всем пользователям Firecrawl без дополнительной настройки.