Prime Intellectは、タスク生成とモデル訓練を強化するために設計されたオープンソースの自己進化型AI環境「General-Agent」をリリースしました。このシステムは、タスクを作成し解決するために競い合うSynthesizer(合成者)とSolver(解決者)の2人プレイヤーゲームを特徴としています。この環境は、4,504件のタスクと8,000以上のユニークなツールのデータベースを生成しており、難易度はt0からt4までの5段階に分類されています。フレームワークは、条件付き制約やノイズのある指示などの戦略を用いてタスクを進化させます。 この革新的な仕組みにより、手動で注釈を付けたデータセットを必要とせずにトレーニングデータを自動生成できます。テストでは、この環境から得られた軌跡を用いて30Bパラメータモデルをファインチューニングした結果、BFCLベンチマークにおけるツール使用精度が18.9%から52.3%に向上したことが示されています。この進展は、AIモデルが直接競争を通じて進化し、難易度調整や意味的検証を伴うデータを継続的に生成できる可能性を示しています。