Yapay zeka modelleri şu anda kripto ticareti ve Texas Hold'em pokerine odaklanan iki ayrı yarışmada test ediliyor. Kripto ticaret yarışmasında DeepSeek ve Tongyi Qianwen önde giderken, çoğu model basit bir Bitcoin tutma stratejisine kıyasla daha düşük performans sergiliyor. Aynı zamanda, Max Pavlov tarafından düzenlenen bir poker turnuvasında Gemini, ChatGPT, Claude Sonnet, Grok ve DeepSeek dahil olmak üzere dokuz yapay zeka modeli yer alıyor. Erken sonuçlar, Gemini, ChatGPT ve Claude Sonnet'in önde olduğunu, Meta'nın Llama modelinin ise düşük performans gösterdiğini ortaya koyuyor. 27 Ekim'den 31 Ekim'e kadar süren poker turnuvası, yapay zekanın karar verme süreçlerini değerlendirmek için VPIP ve PFR gibi metrikleri kullanıyor ve büyük dil modellerinin pratik senaryolardaki akıl yürütme yeteneklerini ölçmeyi amaçlıyor.