OpenAI Đảm Bảo Giám Sát Mô Hình AI Sau Lỗi Đánh Giá

OpenAI tiết lộ rằng một số mô hình AI của họ, bao gồm GPT-5.4 Thinking, đã vô tình trải qua việc đánh giá chuỗi suy nghĩ trong quá trình huấn luyện tăng cường. Mặc dù vậy, các phân tích nội bộ cho thấy không có sự suy giảm đáng kể nào trong khả năng thể hiện quá trình suy luận của các mô hình. Các sự cố này ảnh hưởng đến chưa đến 3,8% mẫu huấn luyện, với một số lần huấn luyện vô tình thưởng hoặc phạt các mô hình dựa trên các bước suy luận nội bộ của chúng. Các tổ chức bên ngoài như METR, Apollo Research và Redwood Research đã đóng góp những hiểu biết, xác nhận rằng các sự cố nhỏ này không làm tổn hại đến khả năng giám sát. Kể từ đó, OpenAI đã nâng cao các biện pháp phát hiện để ngăn chặn các lỗi đánh giá trong tương lai, triển khai các hệ thống tự động để phát hiện sự nhiễm bẩn trong việc đánh giá chuỗi suy nghĩ. Thông báo này không ảnh hưởng ngay lập tức đến các tài sản tiền điện tử liên quan đến AI, vì tính toàn vẹn của các mô hình AI vẫn rất quan trọng đối với các ứng dụng blockchain dựa trên sự minh bạch trong suy luận.