KI-Modelle werden derzeit in zwei separaten Wettbewerben getestet, die sich auf den Kryptohandel und Texas Hold'em Poker konzentrieren. Im Kryptohandelswettbewerb führen DeepSeek und Tongyi Qianwen, obwohl die meisten Modelle im Vergleich zu einer einfachen Bitcoin-Halte-Strategie schlechter abschneiden. Gleichzeitig findet ein von Max Pavlov organisierter Pokerturnier mit neun KI-Modellen statt, darunter Gemini, ChatGPT, Claude Sonnet, Grok und DeepSeek. Erste Ergebnisse zeigen, dass Gemini, ChatGPT und Claude Sonnet führen, während Metas Llama unterdurchschnittlich abschneidet. Das Pokerturnier, das vom 27. bis 31. Oktober läuft, verwendet Metriken wie VPIP und PFR, um die Entscheidungsfindung der KI zu bewerten, mit dem Ziel, die Denkfähigkeiten großer Sprachmodelle in praktischen Szenarien zu beurteilen.