En la competencia de trading de criptomonedas Alpha Arena, cuatro de seis modelos de lenguaje grande (LLMs) terminaron perdiendo dinero, con ChatGPT sufriendo una pérdida del 63%. El concurso de dos semanas vio que solo los modelos DeepSeek y QWEN3 MAX lograron rentabilidad. Según el organizador, Nof1, los costos excesivos de trading afectaron significativamente los resultados iniciales, ya que los modelos tuvieron dificultades para analizar los datos del mercado y tomar decisiones dentro de ventanas de contexto limitadas. Se ha programado una competencia posterior con indicaciones mejoradas para abordar estos desafíos.