AI取引モデルは実際の市場環境で課題に直面しており、最近の公開取引コンペティションによると、ほとんどのシステムが損失を報告しています。テックスタートアップのNof1が運営するAlpha Arenaコンペティションでは、AnthropicのClaudeやOpenAIのChatGPTを含む8つの高度なAIシステムが、それぞれ1万ドルの資本金で米国のテクノロジー株を取引し、これらの苦戦が浮き彫りになりました。コンペティションの結果、全体のポートフォリオは約3分の1の損失を被り、32の結果のうち利益を出したのはわずか6件でした。 コンペティションのデータは、AIモデル間で取引行動に大きな差異があることを示しました。例えば、AlibabaのQwenは1ラウンドで1,418回の取引を行ったのに対し、Grok 4.20はわずか158件の注文を出しました。モデルはまた、意思決定の傾向にも違いがあり、Claudeはロングポジションを好み、Geminiはショートを好む傾向を示しました。これらの課題にもかかわらず、ChatGPTのような一部のモデルは特定の分野で可能性を示し、2025年第4四半期の収益予測方向の予測で68%の精度を達成しました。 AI取引モデルの限界は、株価に影響を与える多数の要因を効果的に評価できないことに起因し、取引タイミングの悪さや過剰取引といった問題を引き起こしています。従来のバックテスト手法は大規模言語モデル(LLM)には不十分であるため、実際の市場でのテストが主要な評価方法となっています。Nof1は、次のAlpha Arenaシーズンに向けて、より多くのデータソースと機能を提供することでAIモデルを強化する計画ですが、同社はAIを直接取引フロアに導入するのではなく、小売トレーダー向けのツール提供に注力しています。