ModernBERT, destilado de DeepSeek-V3-Base, ha sido optimizado para clasificar un subconjunto de 52K/212K de artículos de arXiv. Utilizando inferencia respaldada por vLLM con umbrales de confianza entre 0.70 y 0.71, este enfoque establece un nuevo estándar para la indexación de conjuntos de datos de alto rendimiento, mejorando la eficiencia y precisión en el procesamiento de grandes volúmenes de datos académicos.