Datadog a dévoilé Toto 2, une famille open source de modèles de prévision de séries temporelles, proposant des versions allant jusqu'à 2,5 milliards de paramètres. Toto 2 est le premier dans son domaine à valider la loi d'échelle, montrant une amélioration des performances prédictives avec l'augmentation du nombre de paramètres sans saturation. La famille de modèles, publiée sous licence Apache 2.0, comprend cinq tailles : 4M, 22M, 313M, 1B et 2,5B. Toto 2 excelle dans les évaluations des principaux benchmarks de prévision, se classant premier dans BOOM, GIFT-Eval et TIME. Il introduit un mécanisme de masquage continu par patch, améliorant la vitesse d'inférence en remplaçant la génération autorégressive par une prédiction en un seul passage. Notamment, la version 313M égalise la latence de Chronos-2, un modèle plus petit. Toto 2 démontre également une forte généralisation inter-domaines, surpassant ses concurrents malgré l'utilisation uniquement de métriques de surveillance système et de données synthétiques pour le pré-entraînement.