Компания Cursor представила новый метод обучения «автоустановки» для моделей серии Composer, используя модели предыдущего поколения для настройки сред обучения с подкреплением (RL). Во время обучения Composer 2 модель Composer 1.5 использовалась для автоматической настройки исполняемых сред, что решало проблемы с плохо сконфигурированными установками, которые могут приводить к потере вычислительных ресурсов. Процесс включает чтение документации кода для предложения команд проверки и построение сред до успешного выполнения. Этот метод улучшил производительность Composer 2 на бенчмарке Terminal-Bench до 61,7%, что значительно выше по сравнению с 47,9% у Composer 1.5. Компания Cursor планирует дальше интегрировать старые модели в дополнительные этапы обучения.