La empresa de infraestructura de IA descentralizada Gata ha lanzado el conjunto de datos ChatGPT-RealUser-2.2M, que cuenta con más de 2.24 millones de conversaciones reales y casi 3.56 millones de pares de preguntas y respuestas. Recopilado a través del programa GPT-to-Earn de Gata, el conjunto de datos incluye interacciones con GPT-3.5, GPT-4 y o1 desde 2024 hasta 2025, involucrando a más de 15,000 usuarios. Cabe destacar que es el doble del tamaño de conjuntos de datos anteriores del Allen Institute for AI e incluye un contenido sustancial relacionado con criptomonedas debido a su mecanismo de incentivos en cadena. Una vista previa con 600 muestras de conversación está disponible en Hugging Face, mientras que el conjunto completo está destinado a aplicaciones de investigación y comerciales. Este lanzamiento sigue a la ronda de financiación semilla de 4 millones de dólares de Gata en mayo de 2025, respaldada por YZi Labs e IDG Blockchain.