La empresa de infraestructura de IA descentralizada Gata ha lanzado el conjunto de datos ChatGPT-RealUser-2.2M, que cuenta con más de 2.24 millones de conversaciones reales y casi 3.56 millones de pares de preguntas y respuestas. Recopilado a través del programa GPT-to-Earn de Gata, el conjunto de datos incluye interacciones con GPT-3.5, GPT-4 y o1 desde 2024 hasta 2025, involucrando a más de 15,000 usuarios. Cabe destacar que es el doble del tamaño de conjuntos de datos anteriores del Allen Institute for AI e incluye un contenido sustancial relacionado con criptomonedas debido a su mecanismo de incentivos en cadena.
Una vista previa con 600 muestras de conversación está disponible en Hugging Face, mientras que el conjunto completo está destinado a aplicaciones de investigación y comerciales. Este lanzamiento sigue a la ronda de financiación semilla de 4 millones de dólares de Gata en mayo de 2025, respaldada por YZi Labs e IDG Blockchain.
Gata presenta el conjunto de datos ChatGPT-RealUser-2.2M con 2.24 millones de conversaciones
Aviso legal: El contenido de Phemex News es únicamente informativo.No garantizamos la calidad, precisión ni integridad de la información procedente de artículos de terceros.El contenido de esta página no constituye asesoramiento financiero ni de inversión.Le recomendamos encarecidamente que realice su propia investigación y consulte con un asesor financiero cualificado antes de tomar cualquier decisión de inversión.