分散型AIインフラ企業のGataは、224万件以上の実際の会話と約356万件のQ&Aペアを収録したChatGPT-RealUser-2.2Mデータセットを発表しました。GataのGPT-to-Earnプログラムを通じて収集されたこのデータセットには、2024年から2025年にかけて15,000人以上のユーザーが参加したGPT-3.5、GPT-4、およびo1との対話が含まれています。特筆すべきは、これはAllen Institute for AIの以前のデータセットの2倍の規模であり、オンチェーンのインセンティブメカニズムにより暗号関連のコンテンツが豊富に含まれている点です。 600件の会話サンプルを含むプレビューがHugging Faceで利用可能であり、完全なデータセットは研究および商用利用を目的としています。このリリースは、2025年5月にYZi LabsとIDG Blockchainが支援したGataの400万ドルのシード資金調達ラウンドに続くものです。