Anthropic đã công bố một phương pháp đột phá trong việc điều chỉnh AI, đạt tỷ lệ không lệch hướng 0% trong mô hình Claude 4.5 của mình. Công ty tiết lộ rằng các phương pháp truyền thống trong việc huấn luyện AI bằng các ví dụ về hành vi đúng đắn là không đủ, chỉ giảm tỷ lệ lệch hướng từ 22% xuống còn 15%. Thay vào đó, thành công của Anthropic đến từ các chiến lược sáng tạo đã tái định hình các giá trị cốt lõi của mô hình.
Chìa khóa cho thành tựu này là bộ dữ liệu "Lời khuyên Khó khăn" (Difficult Advice), đã huấn luyện mô hình cung cấp hướng dẫn đạo đức phù hợp với "Hiến pháp Claude," giảm tỷ lệ lệch hướng xuống còn 3%. Ngoài ra, việc Tinh chỉnh Tài liệu Tổng hợp (Synthetic Document Fine-tuning - SDF) được sử dụng để chống lại các định kiến tiêu cực về AI bằng cách tích hợp các câu chuyện hư cấu và các cuộc thảo luận về hiến pháp, từ đó nâng cao hơn nữa hành vi của mô hình. Những phương pháp này, kết hợp với các môi trường huấn luyện an toàn đa dạng, đã dẫn đến việc phát hành chính thức Claude 4.5 với tỷ lệ lệch hướng 0%.
Anthropic Đạt Tỷ Lệ Sai Lệch AI 0% Nhờ Phương Pháp Đào Tạo Đổi Mới
Tuyên bố miễn trừ trách nhiệm: Nội dung được cung cấp trên Phemex News chỉ nhằm mục đích cung cấp thông tin.Chúng tôi không đảm bảo chất lượng, độ chính xác hoặc tính đầy đủ của thông tin có nguồn từ các bài viết của bên thứ ba.Nội dung trên trang này không cấu thành lời khuyên về tài chính hoặc đầu tư.Chúng tôi đặc biệt khuyến khích bạn tự tiến hành nghiên cứu và tham khảo ý kiến của cố vấn tài chính đủ tiêu chuẩn trước khi đưa ra bất kỳ quyết định đầu tư nào.
