Datadog ha presentado Toto 2, una familia de modelos de pronóstico de series temporales de código abierto, que incluye versiones con hasta 2.5 mil millones de parámetros. Toto 2 es el primero en su ámbito en validar la ley de escalamiento, mostrando un mejor rendimiento predictivo con el aumento de parámetros sin saturación. La familia de modelos, lanzada bajo la licencia Apache 2.0, incluye cinco tamaños: 4M, 22M, 313M, 1B y 2.5B. Toto 2 destaca en evaluaciones en los principales puntos de referencia de pronóstico, ubicándose en primer lugar en BOOM, GIFT-Eval y TIME. Introduce un mecanismo continuo de enmascaramiento de parches, que mejora la velocidad de inferencia al reemplazar la generación autorregresiva con una predicción hacia adelante de un solo paso. Notablemente, la versión de 313M iguala la latencia de Chronos-2, un modelo más pequeño. Toto 2 también demuestra una fuerte generalización entre dominios, superando a sus competidores a pesar de usar solo métricas de monitoreo del sistema y datos sintéticos para el preentrenamiento.