Xiaomi'nin büyük model ekibinin başı Luo Fuli, büyük model alanında Chat döneminden Agent dönemine önemli bir geçiş olduğunu ve bu geçişte eğitim sonrası sürecin vurgulandığını duyurdu. Bu değişim, hesaplama tahsis stratejilerini değiştirdi; önde gelen ekipler arasında ön eğitim ile eğitim sonrası hesaplama oranı artık 1:1 seviyesine ulaştı. Önceden, Chat döneminde bu oran 3:5:1 idi. Luo, artık odak noktasının Agentlar için pekiştirmeli öğrenmenin ölçeklendirilmesi olduğunu ve karmaşık iş akışlarını ve heterojen küme zamanlamasını desteklemek için sistem mimarisinde değişiklikler yapılması gerektiğini belirtti.