Gradient a lancé Echo-2, un nouveau cadre d'apprentissage par renforcement distribué qui améliore considérablement l'efficacité de la recherche en IA. En découplant les Learners et les Actors, Echo-2 réduit le coût post-entraînement d'un modèle de 30 milliards de paramètres de 4 500 $ à 425 $, atteignant ainsi un débit de recherche plus de 10 fois supérieur. Le cadre utilise la séparation calcul-stockage pour un entraînement asynchrone et décharge les charges d'échantillonnage vers des instances GPU instables, tout en maintenant la précision du modèle grâce à des innovations telles que la staleness bornée et la planification tolérante aux pannes d'instance. En parallèle avec Echo-2, Gradient s'apprête à lancer sa plateforme RLaaS, Logits, qui vise à faire passer la recherche en IA d'une innovation intensive en capital à une innovation axée sur l'efficacité. Logits accepte désormais les inscriptions sur liste d'attente à l'échelle mondiale pour les étudiants et les chercheurs.