NVIDIA AI는 강화 학습(RL) 훈련을 향상시키기 위해 오픈 소스 라이브러리인 NVIDIA NeMo RL에 FP8 지원을 통합했다고 발표했습니다. 저정밀도 FP8 포맷의 추가는 계산 작업 부하를 가속화하여 Qwen3-8B-Base 모델에서 RL 작업 속도를 1.48배 향상시키는 것을 목표로 합니다. 이 향상은 에이전트 도구 사용 및 다단계 작업에 대한 반복 주기를 더 빠르게 하여 RL 응용 프로그램의 효율성을 높일 것으로 기대됩니다.