A empresa de infraestrutura de IA descentralizada Gata lançou o conjunto de dados ChatGPT-RealUser-2.2M, que apresenta mais de 2,24 milhões de conversas reais e quase 3,56 milhões de pares de perguntas e respostas. Coletado por meio do programa GPT-to-Earn da Gata, o conjunto de dados inclui interações com GPT-3.5, GPT-4 e o1 de 2024 a 2025, envolvendo mais de 15.000 usuários. Notavelmente, é duas vezes maior que os conjuntos de dados anteriores do Allen Institute for AI e inclui um conteúdo substancial relacionado a criptomoedas devido ao seu mecanismo de incentivo on-chain.
Uma prévia com 600 amostras de conversas está disponível no Hugging Face, enquanto o conjunto completo de dados é destinado a aplicações de pesquisa e comerciais. Este lançamento segue a rodada de financiamento seed de US$ 4 milhões da Gata em maio de 2025, apoiada pela YZi Labs e IDG Blockchain.
Gata Lança o Conjunto de Dados ChatGPT-RealUser-2.2M com 2,24 Milhões de Conversas
Aviso Legal: O conteúdo disponibilizado no Phemex News é apenas para fins informativos. Não garantimos a qualidade, precisão ou integridade das informações provenientes de artigos de terceiros. Este conteúdo não constitui aconselhamento financeiro ou de investimento. Recomendamos fortemente que você realize suas próprias pesquisas e consulte um consultor financeiro qualificado antes de tomar decisões de investimento.