La société d'infrastructure d'IA décentralisée Gata a lancé le jeu de données ChatGPT-RealUser-2.2M, comprenant plus de 2,24 millions de conversations réelles et près de 3,56 millions de paires questions-réponses. Collecté via le programme GPT-to-Earn de Gata, ce jeu de données inclut des interactions avec GPT-3.5, GPT-4 et o1 de 2024 à 2025, impliquant plus de 15 000 utilisateurs. Notamment, il est deux fois plus volumineux que les jeux de données précédents de l'Allen Institute for AI et contient une quantité importante de contenu lié à la cryptomonnaie grâce à son mécanisme d'incitation on-chain. Un aperçu avec 600 échantillons de conversations est disponible sur Hugging Face, tandis que le jeu de données complet est destiné à des applications de recherche et commerciales. Cette sortie fait suite à une levée de fonds de 4 millions de dollars en seed round en mai 2025, soutenue par YZi Labs et IDG Blockchain.