Децентрализованная компания по инфраструктуре ИИ Gata запустила набор данных ChatGPT-RealUser-2.2M, включающий более 2,24 миллиона реальных разговоров и почти 3,56 миллиона пар вопросов и ответов. Собранный в рамках программы GPT-to-Earn от Gata, набор данных содержит взаимодействия с моделями GPT-3.5, GPT-4 и o1 за период с 2024 по 2025 год, в которых приняли участие более 15 000 пользователей. Примечательно, что он вдвое больше предыдущих наборов данных Института Аллена по ИИ и содержит значительное количество контента, связанного с криптовалютами, благодаря механизму стимулирования на блокчейне. Предварительный просмотр с 600 образцами разговоров доступен на Hugging Face, тогда как полный набор данных предназначен для исследовательских и коммерческих целей. Этот релиз последовал за раундом посевного финансирования Gata на сумму 4 миллиона долларов в мае 2025 года, поддержанным YZi Labs и IDG Blockchain.