Luo Fuli, trưởng nhóm mô hình lớn của Xiaomi, đã công bố một sự chuyển đổi quan trọng trong lĩnh vực mô hình lớn từ thời đại Chat sang thời đại Agent, nhấn mạnh vào giai đoạn hậu huấn luyện. Sự chuyển đổi này đã thay đổi chiến lược phân bổ tài nguyên tính toán, với tỷ lệ tính toán giữa tiền huấn luyện và hậu huấn luyện hiện đạt 1:1 trong số các nhóm hàng đầu. Trước đây, tỷ lệ này là 3:5:1 trong thời đại Chat. Luo lưu ý rằng hiện nay trọng tâm là mở rộng học tăng cường cho các Agent, đòi hỏi phải thay đổi kiến trúc hệ thống để hỗ trợ các quy trình làm việc phức tạp và lập lịch cụm dị thể.