분산형 AI 인프라 기업 가타(Gata)는 224만 건 이상의 실제 대화와 약 356만 개의 질문 및 답변 쌍을 포함한 ChatGPT-RealUser-2.2M 데이터셋을 출시했습니다. 가타의 GPT-투-언(GPT-to-Earn) 프로그램을 통해 수집된 이 데이터셋은 2024년부터 2025년까지 GPT-3.5, GPT-4, o1과의 상호작용을 포함하며 15,000명 이상의 사용자가 참여했습니다. 특히, 이 데이터셋은 앨런 인스티튜트 포 AI(Allen Institute for AI)의 이전 데이터셋보다 두 배 크며, 온체인 인센티브 메커니즘 덕분에 상당한 양의 암호화폐 관련 콘텐츠를 포함하고 있습니다.
600개의 대화 샘플로 구성된 미리보기는 허깅페이스(Hugging Face)에서 제공되며, 전체 데이터셋은 연구 및 상업적 용도로 사용될 예정입니다. 이번 출시 이전에 가타는 2025년 5월 YZi Labs와 IDG 블록체인의 지원을 받아 400만 달러 규모의 시드 펀딩 라운드를 완료했습니다.
가타, 224만 대화가 포함된 ChatGPT-RealUser-2.2M 데이터셋 공개
면책 조항: Phemex 뉴스에서 제공하는 콘텐츠는 정보 제공 목적으로만 제공됩니다. 제3자 기사에서 출처를 얻은 정보의 품질, 정확성 또는 완전성을 보장하지 않습니다.이 페이지의 콘텐츠는 재무 또는 투자 조언이 아닙니다.투자 결정을 내리기 전에 반드시 스스로 조사하고 자격을 갖춘 재무 전문가와 상담하시기 바랍니다.