Odyssey has introduced PROWL, a reinforcement learning-driven framework designed to enhance world model training. The PROWL system uses a behavior-constrained RL agent to identify and address failure trajectories in world models, focusing on geometric, motion, visual consistency, and action responsiveness. This approach establishes a scalable feedback loop, utilizing a Prioritized Adversarial Trajectory buffer to prioritize unresolved challenges, thereby fostering continuous model improvement.
The framework was validated in the MineRL environment within Minecraft, demonstrating a 12.6% reduction in Action Following Error on 300 human operation segments, with improvements reaching 20.9% on the most challenging segments. Odyssey, co-founded by Oliver Cameron and Jeff Hawke, recently secured investments from NVentures and Samsung Next, alongside existing backers GV, EQT, and Air Street Capital.
Odyssey Unveils PROWL Framework to Enhance World Model Training
Tuyên bố miễn trừ trách nhiệm: Nội dung được cung cấp trên Phemex News chỉ nhằm mục đích cung cấp thông tin.Chúng tôi không đảm bảo chất lượng, độ chính xác hoặc tính đầy đủ của thông tin có nguồn từ các bài viết của bên thứ ba.Nội dung trên trang này không cấu thành lời khuyên về tài chính hoặc đầu tư.Chúng tôi đặc biệt khuyến khích bạn tự tiến hành nghiên cứu và tham khảo ý kiến của cố vấn tài chính đủ tiêu chuẩn trước khi đưa ra bất kỳ quyết định đầu tư nào.
