Yapay zeka (YZ) ticaret modelleri, canlı piyasa ortamlarında zorluklarla karşılaşıyor ve çoğu sistemin zarar bildirdiği, yakın zamanda yapılan kamuya açık ticaret yarışmalarına göre ortaya çıktı. Teknoloji girişimi Nof1 tarafından düzenlenen Alpha Arena yarışması, Anthropic’in Claude ve OpenAI’nin ChatGPT’si dahil olmak üzere sekiz gelişmiş YZ sisteminin her biri 10.000 dolar başlangıç sermayesiyle ABD teknoloji hisseleri ticareti yaparken bu mücadeleleri gözler önüne serdi. Yarışma, genel portföyün yaklaşık üçte bir oranında zarar ettiğini ve 32 sonuçtan yalnızca altısının kârla sonuçlandığını ortaya koydu. Yarışma verileri, YZ modelleri arasında ticaret davranışlarında önemli farklılıklar olduğunu gösterdi. Örneğin, Alibaba’nın Qwen modeli bir turda 1.418 işlem gerçekleştirirken, Grok 4.20 sadece 158 emir verdi. Modeller ayrıca farklı karar verme eğilimleri sergiledi; Claude uzun pozisyonları tercih ederken, Gemini kısa pozisyonlara yöneldi. Bu zorluklara rağmen, ChatGPT gibi bazı modeller belirli alanlarda potansiyel gösterdi ve 2025’in dördüncü çeyreği için kazanç tahmin yönlerini %68 doğruluk oranıyla tahmin etti. YZ ticaret modellerinin sınırlamaları, hisse senedi fiyatlarını etkileyen birçok faktörü etkili bir şekilde değerlendirememelerine bağlanıyor; bu da kötü işlem zamanlaması ve aşırı işlem gibi sorunlara yol açıyor. Geleneksel geriye dönük test yöntemleri LLM’ler için yetersiz kaldığından, canlı piyasa testi birincil değerlendirme yöntemi olmaya devam ediyor. Nof1, Alpha Arena’nın bir sonraki sezonu için YZ modellerini daha fazla veri kaynağı ve yetenekle geliştirmeyi planlıyor, ancak şirket doğrudan ticaret katlarında YZ kullanmaktan ziyade perakende yatırımcılara araçlar sunmaya odaklanıyor.