ModernBERT, destilado do DeepSeek-V3-Base, foi otimizado para classificar um subconjunto de 52 mil/212 mil artigos do arXiv. Utilizando inferência suportada por vLLM com limiares de confiança entre 0,70 e 0,71, essa abordagem estabelece um novo padrão para indexação de conjuntos de dados de alta produtividade, aumentando a eficiência e a precisão no processamento de grandes volumes de dados acadêmicos.