Das dezentrale KI-Infrastrukturunternehmen Gata hat den Datensatz ChatGPT-RealUser-2.2M veröffentlicht, der über 2,24 Millionen echte Gespräche und fast 3,56 Millionen Frage-Antwort-Paare enthält. Der Datensatz wurde im Rahmen von Gatas GPT-to-Earn-Programm gesammelt und umfasst Interaktionen mit GPT-3.5, GPT-4 und o1 aus den Jahren 2024 bis 2025, an denen mehr als 15.000 Nutzer beteiligt waren. Bemerkenswert ist, dass der Datensatz doppelt so groß ist wie frühere Datensätze des Allen Institute for AI und aufgrund seines On-Chain-Anreizmechanismus einen erheblichen Anteil an kryptobezogenen Inhalten enthält. Eine Vorschau mit 600 Gesprächsbeispielen ist auf Hugging Face verfügbar, während der vollständige Datensatz für Forschungs- und kommerzielle Anwendungen vorgesehen ist. Diese Veröffentlichung folgt auf die Seed-Finanzierungsrunde von Gata im Mai 2025 in Höhe von 4 Millionen US-Dollar, die von YZi Labs und IDG Blockchain unterstützt wurde.