Cursor ha presentado un novedoso método de entrenamiento "autoinstall" para sus modelos de la serie Composer, aprovechando modelos de generaciones anteriores para configurar entornos de aprendizaje por refuerzo (RL). Durante el entrenamiento de Composer 2, se utilizó Composer 1.5 para configurar automáticamente entornos ejecutables, abordando problemas de configuraciones deficientes que pueden desperdiciar recursos computacionales. El proceso implica leer la documentación del código base para proponer comandos de verificación y construir entornos hasta lograr una ejecución exitosa. Este método mejoró el rendimiento de Composer 2 en el benchmark Terminal-Bench al 61,7%, un aumento significativo respecto al 47,9% de Composer 1.5. Cursor busca integrar aún más los modelos antiguos en etapas adicionales de entrenamiento.