A Cursor revelou um novo método de treinamento "autoinstall" para seus modelos da série Composer, aproveitando modelos de gerações anteriores para configurar ambientes para aprendizado por reforço (RL). Durante o treinamento do Composer 2, o Composer 1.5 foi usado para configurar automaticamente ambientes executáveis, resolvendo problemas de configurações inadequadas que podem desperdiçar recursos computacionais. O processo envolve a leitura da documentação da base de código para propor comandos de verificação e construir ambientes até a execução bem-sucedida. Esse método melhorou o desempenho do Composer 2 no benchmark Terminal-Bench para 61,7%, um aumento significativo em relação aos 47,9% do Composer 1.5. A Cursor pretende integrar ainda mais modelos antigos em etapas adicionais de treinamento.