ModernBERT, созданный на основе DeepSeek-V3-Base, был оптимизирован для классификации подмножества из 52 тысяч и 212 тысяч статей arXiv. Используя вывод на базе vLLM с порогами уверенности от 0,70 до 0,71, этот подход устанавливает новый стандарт для высокопроизводительной индексации наборов данных, повышая эффективность и точность обработки больших объемов академических данных.