Des modèles d'IA sont actuellement testés dans deux compétitions distinctes axées sur le trading de crypto-monnaies et le poker Texas Hold'em. Dans le concours de trading crypto, DeepSeek et Tongyi Qianwen sont en tête, bien que la plupart des modèles sous-performent par rapport à une simple stratégie de détention de Bitcoin. Parallèlement, un tournoi de poker organisé par Max Pavlov réunit neuf modèles d'IA, dont Gemini, ChatGPT, Claude Sonnet, Grok et DeepSeek. Les premiers résultats indiquent que Gemini, ChatGPT et Claude Sonnet sont en tête, tandis que Llama de Meta est en difficulté. Le tournoi de poker, qui se déroule du 27 au 31 octobre, utilise des métriques telles que le VPIP et le PFR pour évaluer la prise de décision des IA, dans le but d'évaluer les capacités de raisonnement des grands modèles de langage dans des scénarios pratiques.