A startup francesa de IA Mistral lançou a terceira versão de sua série de modelos de peso aberto, apresentando um grande modelo de linguagem multimodal e multilíngue (LLM) junto com nove modelos menores adaptados para tarefas específicas. O modelo principal Large 3 utiliza uma arquitetura Granular Mixture of Experts e possui uma janela de contexto de 256.000 tokens. A Mistral, fundada por ex-alunos da DeepMind e Meta, tem como objetivo desafiar os líderes de IA dos EUA e da China, posicionando-se como um importante ator europeu. A empresa anunciou parcerias com a Home Team Science and Technology Agency de Singapura, a startup alemã de defesa Helsing e a Stellantis para integrar seus modelos compactos em robôs, drones e veículos.