Firecrawl представила Fire-PDF, новый движок для парсинга PDF, переписанный на Rust, что значительно ускоряет преобразование PDF в структурированный Markdown. Новый движок обеспечивает увеличение скорости в 3,5–5,7 раза по сравнению с предыдущей версией, при этом среднее время обработки составляет менее 400 миллисекунд на страницу. Этот прирост производительности достигается за счёт уменьшения количества вызовов GPU.
Firecrawl также открыла исходный код библиотеки на Rust под названием pdf-inspector, которая эффективно классифицирует страницы PDF. Страницы с чистым текстом обрабатываются без использования GPU, тогда как отсканированные или насыщенные изображениями страницы обрабатываются с помощью моделей нейронных сетей. Fire-PDF применяет специальные параметры для разных типов контента, обеспечивая точность при работе с таблицами, формулами и много колонными макетами. Новый движок автоматически доступен всем пользователям Firecrawl без дополнительной настройки.
Firecrawl представила парсер PDF на Rust, увеличивающий скорость работы до 5,7 раза
Отказ от ответственности: Контент, представленный на сайте Phemex News, предназначен исключительно для информационных целей.Мы не гарантируем качество, точность и полноту информации, полученной из статей третьих лиц.Содержание этой страницы не является финансовым или инвестиционным советом.Мы настоятельно рекомендуем вам провести собственное исследование и проконсультироваться с квалифицированным финансовым консультантом, прежде чем принимать какие-либо инвестиционные решения.
