Cursor hat eine neuartige "Autoinstall"-Trainingsmethode für seine Composer-Serienmodelle vorgestellt, bei der Modelle der vorherigen Generation genutzt werden, um Umgebungen für das Reinforcement Learning (RL) einzurichten. Während des Trainings von Composer 2 wurde Composer 1.5 verwendet, um automatisch ausführbare Umgebungen zu konfigurieren, wodurch Probleme mit schlecht konfigurierten Setups, die Rechenressourcen verschwenden können, behoben wurden. Der Prozess umfasst das Lesen der Codebasis-Dokumentation, um Verifikationsbefehle vorzuschlagen, und das Erstellen von Umgebungen, bis eine erfolgreiche Ausführung erreicht wird. Diese Methode verbesserte die Leistung von Composer 2 im Terminal-Bench-Benchmark auf 61,7 %, was eine deutliche Steigerung gegenüber den 47,9 % von Composer 1.5 darstellt. Cursor plant, ältere Modelle weiter in zusätzliche Trainingsphasen zu integrieren.