A xAI de Elon Musk está enfrentando desafios significativos com a utilização de suas GPUs, operando atualmente com apenas 11% de eficiência. A empresa gerencia aproximadamente 550.000 GPUs NVIDIA, incluindo os modelos H100 e H200, distribuídas entre seus data centers em Memphis e Colossus. Apesar da escala impressionante, a baixa utilização evidencia ineficiências na pilha de software de IA da xAI. A subutilização é atribuída a problemas de coordenação entre o grande número de GPUs, resultando em períodos ociosos e gargalos na transmissão de dados. Esse problema não é exclusivo da xAI, já que a indústria de IA enfrenta dificuldades para otimizar infraestruturas em larga escala. Enquanto empresas como Meta e Google alcançam taxas de utilização acima de 40%, a xAI pretende melhorar sua eficiência para 50% por meio do aprimoramento de sua infraestrutura e pilha de software. Elon Musk também está explorando o desenvolvimento interno de chips e aproveitando a tecnologia da Intel para enfrentar esses desafios.