Cursor는 이전 세대 모델을 활용하여 강화 학습(RL)을 위한 환경을 설정하는 새로운 '자동 설치(autoinstall)' 훈련 방법을 Composer 시리즈 모델에 도입했습니다. Composer 2의 훈련 과정에서 Composer 1.5가 실행 가능한 환경을 자동으로 구성하는 데 사용되어, 잘못 구성된 설정으로 인해 계산 자원이 낭비되는 문제를 해결했습니다. 이 과정은 코드베이스 문서를 읽어 검증 명령을 제안하고, 성공적으로 실행될 때까지 환경을 구축하는 방식으로 진행됩니다. 이 방법은 Terminal-Bench 벤치마크에서 Composer 2의 성능을 61.7%로 향상시켰으며, 이는 Composer 1.5의 47.9%에 비해 상당한 증가입니다. Cursor는 더 나아가 이전 모델들을 추가 훈련 단계에 통합하는 것을 목표로 하고 있습니다.