샤오미의 루오 푸리가 대형 모델의 사후 학습 시대로의 전환을 강조하다

샤오미 대형 모델 팀장인 루오 푸리는 대형 모델 분야가 챗(Chat) 시대에서 에이전트(Agent) 시대로 크게 전환되었으며, 사후 학습(post-training)에 중점을 두고 있다고 발표했습니다. 이 전환은 컴퓨팅 자원 할당 전략에 변화를 가져왔으며, 선도 팀들 사이에서 사전 학습(pre-training)과 사후 학습의 컴퓨팅 비율이 이제 1:1에 이르렀습니다. 이전에는 챗 시대에 3:5:1 비율이었습니다. 루오는 현재 에이전트의 강화 학습 확장에 초점이 맞춰져 있으며, 복잡한 워크플로우와 이기종 클러스터 스케줄링을 지원하기 위해 시스템 아키텍처의 변화가 필요하다고 언급했습니다.

출처: 원본 보기

면책 조항: Phemex 뉴스에서 제공하는 콘텐츠는 정보 제공 목적으로만 제공됩니다. 제3자 기사에서 출처를 얻은 정보의 품질, 정확성 또는 완전성을 보장하지 않습니다.이 페이지의 콘텐츠는 재무 또는 투자 조언이 아닙니다.투자 결정을 내리기 전에 반드시 스스로 조사하고 자격을 갖춘 재무 전문가와 상담하시기 바랍니다.

함께 보면 좋은 콘텐츠