샤오미 대형 모델 팀장인 루오 푸리는 대형 모델 분야가 챗(Chat) 시대에서 에이전트(Agent) 시대로 크게 전환되었으며, 사후 학습(post-training)에 중점을 두고 있다고 발표했습니다. 이 전환은 컴퓨팅 자원 할당 전략에 변화를 가져왔으며, 선도 팀들 사이에서 사전 학습(pre-training)과 사후 학습의 컴퓨팅 비율이 이제 1:1에 이르렀습니다. 이전에는 챗 시대에 3:5:1 비율이었습니다. 루오는 현재 에이전트의 강화 학습 확장에 초점이 맞춰져 있으며, 복잡한 워크플로우와 이기종 클러스터 스케줄링을 지원하기 위해 시스템 아키텍처의 변화가 필요하다고 언급했습니다.