В настоящее время модели ИИ тестируются в двух отдельных соревнованиях, посвящённых криптотрейдингу и покеру Техасский Холдем. В конкурсе по криптотрейдингу лидируют DeepSeek и Tongyi Qianwen, хотя большинство моделей показывают результаты хуже, чем простая стратегия удержания биткоина. Одновременно проходит покерный турнир, организованный Максом Павловым, в котором участвуют девять моделей ИИ, включая Gemini, ChatGPT, Claude Sonnet, Grok и DeepSeek. Ранние результаты показывают, что лидируют Gemini, ChatGPT и Claude Sonnet, в то время как Llama от Meta выступает хуже. Покерный турнир, проходящий с 27 по 31 октября, использует такие метрики, как VPIP и PFR, для оценки принятия решений ИИ, с целью проверить способности больших языковых моделей к рассуждению в практических сценариях.