Công ty hạ tầng AI phi tập trung Gata đã ra mắt bộ dữ liệu ChatGPT-RealUser-2.2M, bao gồm hơn 2,24 triệu cuộc trò chuyện thực tế và gần 3,56 triệu cặp câu hỏi và trả lời. Bộ dữ liệu được thu thập thông qua chương trình GPT-to-Earn của Gata, bao gồm các tương tác với GPT-3.5, GPT-4 và o1 từ năm 2024 đến 2025, với sự tham gia của hơn 15.000 người dùng. Đáng chú ý, bộ dữ liệu này có kích thước gấp đôi so với các bộ dữ liệu trước đây của Viện Allen về AI và bao gồm nhiều nội dung liên quan đến tiền điện tử nhờ cơ chế khuyến khích trên chuỗi.
Một bản xem trước với 600 mẫu cuộc trò chuyện có sẵn trên Hugging Face, trong khi bộ dữ liệu đầy đủ được dự kiến sử dụng cho nghiên cứu và ứng dụng thương mại. Việc phát hành này diễn ra sau vòng gọi vốn hạt giống 4 triệu đô la của Gata vào tháng 5 năm 2025, được hỗ trợ bởi YZi Labs và IDG Blockchain.
Gata Ra Mắt Bộ Dữ Liệu ChatGPT-RealUser-2.2M với 2,24 Triệu Cuộc Trò Chuyện
Tuyên bố miễn trừ trách nhiệm: Nội dung được cung cấp trên Phemex News chỉ nhằm mục đích cung cấp thông tin.Chúng tôi không đảm bảo chất lượng, độ chính xác hoặc tính đầy đủ của thông tin có nguồn từ các bài viết của bên thứ ba.Nội dung trên trang này không cấu thành lời khuyên về tài chính hoặc đầu tư.Chúng tôi đặc biệt khuyến khích bạn tự tiến hành nghiên cứu và tham khảo ý kiến của cố vấn tài chính đủ tiêu chuẩn trước khi đưa ra bất kỳ quyết định đầu tư nào.