La société d'infrastructure d'IA décentralisée Gata a lancé le jeu de données ChatGPT-RealUser-2.2M, comprenant plus de 2,24 millions de conversations réelles et près de 3,56 millions de paires questions-réponses. Collecté via le programme GPT-to-Earn de Gata, ce jeu de données inclut des interactions avec GPT-3.5, GPT-4 et o1 de 2024 à 2025, impliquant plus de 15 000 utilisateurs. Notamment, il est deux fois plus volumineux que les jeux de données précédents de l'Allen Institute for AI et contient une quantité importante de contenu lié à la cryptomonnaie grâce à son mécanisme d'incitation on-chain.
Un aperçu avec 600 échantillons de conversations est disponible sur Hugging Face, tandis que le jeu de données complet est destiné à des applications de recherche et commerciales. Cette sortie fait suite à une levée de fonds de 4 millions de dollars en seed round en mai 2025, soutenue par YZi Labs et IDG Blockchain.
Gata dévoile le jeu de données ChatGPT-RealUser-2.2M avec 2,24 millions de conversations
Avertissement : Le contenu proposé sur Phemex News est à titre informatif uniquement. Nous ne garantissons pas la qualité, l'exactitude ou l'exhaustivité des informations provenant d'articles tiers. Ce contenu ne constitue pas un conseil financier ou d'investissement. Nous vous recommandons vivement d'effectuer vos propres recherches et de consulter un conseiller financier qualifié avant toute décision d'investissement.