Cursor a dévoilé une nouvelle méthode d'entraînement « autoinstall » pour ses modèles de la série Composer, exploitant les modèles de génération précédente pour configurer des environnements d'apprentissage par renforcement (RL). Lors de l'entraînement de Composer 2, Composer 1.5 a été utilisé pour configurer automatiquement des environnements exécutables, résolvant ainsi les problèmes de configurations mal adaptées qui peuvent gaspiller des ressources informatiques. Le processus consiste à lire la documentation de la base de code pour proposer des commandes de vérification et construire les environnements jusqu'à une exécution réussie. Cette méthode a amélioré la performance de Composer 2 sur le benchmark Terminal-Bench à 61,7 %, une augmentation significative par rapport aux 47,9 % de Composer 1.5. Cursor vise à intégrer davantage les anciens modèles dans des étapes d'entraînement supplémentaires.