Datadog은 최대 25억 개의 매개변수를 갖춘 버전을 포함하는 시계열 예측 모델의 오픈 소스 패밀리인 Toto 2를 공개했습니다. Toto 2는 이 분야에서 처음으로 스케일링 법칙을 검증하여 매개변수가 증가해도 포화 없이 예측 성능이 향상됨을 보여줍니다. Apache 2.0 라이선스 하에 출시된 이 모델 패밀리는 4M, 22M, 313M, 1B, 2.5B의 다섯 가지 크기를 포함합니다. Toto 2는 주요 예측 벤치마크 평가에서 뛰어난 성과를 보이며 BOOM, GIFT-Eval, TIME에서 1위를 차지했습니다. 연속 패치 마스킹 메커니즘을 도입하여 자기회귀 생성 방식을 단일 패스 전방 예측으로 대체함으로써 추론 속도를 향상시켰습니다. 특히 313M 버전은 더 작은 모델인 Chronos-2와 동일한 지연 시간을 보입니다. 또한 Toto 2는 시스템 모니터링 지표와 합성 데이터만을 사용한 사전 학습에도 불구하고 강력한 교차 도메인 일반화 능력을 보여 경쟁 모델들을 능가합니다.