分散型AIインフラ企業のGataは、224万件以上の実際の会話と約356万件のQ&Aペアを収録したChatGPT-RealUser-2.2Mデータセットを発表しました。GataのGPT-to-Earnプログラムを通じて収集されたこのデータセットには、2024年から2025年にかけて15,000人以上のユーザーが参加したGPT-3.5、GPT-4、およびo1との対話が含まれています。特筆すべきは、これはAllen Institute for AIの以前のデータセットの2倍の規模であり、オンチェーンのインセンティブメカニズムにより暗号関連のコンテンツが豊富に含まれている点です。
600件の会話サンプルを含むプレビューがHugging Faceで利用可能であり、完全なデータセットは研究および商用利用を目的としています。このリリースは、2025年5月にYZi LabsとIDG Blockchainが支援したGataの400万ドルのシード資金調達ラウンドに続くものです。
Gata、224万件の会話を含むChatGPT-RealUser-2.2Mデータセットを公開
免責事項: Phemexニュースで提供されるコンテンツは、あくまで情報提供を目的としたものであり、第三者の記事から取得した情報の正確性・完全性・信頼性について保証するものではありません。本コンテンツは金融または投資の助言を目的としたものではなく、投資に関する最終判断はご自身での調査と、信頼できる専門家への相談を踏まえて行ってください。