Le fournisseur de cloud IA Zyphra a réalisé un test comparatif en utilisant la puce MI355X d'AMD, comparant ses performances à celles du B200 de NVIDIA. Les tests, qui ont exécuté des modèles tels que DeepSeek V3.2 et GLM-5.1, ont mis en évidence l'avantage d'AMD en termes de capacité de VRAM, avec 288 Go contre 180 Go pour le B200, permettant un traitement plus efficace des textes longs sans configurations multi-GPU. Cependant, la MI355X d'AMD rencontre des difficultés au niveau de la connectivité inter-puces, étant en retard par rapport aux capacités de bande passante NVLink de NVIDIA. Pour pallier ces limitations, Zyphra a développé des algorithmes de parallélisme de séquence tensorielle et d'attention arborescente, améliorant l'efficacité du transfert de données. Alors que le B200 de NVIDIA conserve une avance en vitesse de requête unique, la pile logicielle optimisée de Zyphra permet à la MI355X de réduire l'écart de débit dans les scénarios à contexte long. Zyphra prévoit d'améliorer davantage les capacités de la MI355X en supportant des modèles plus grands et en développant de nouveaux schémas de quantification.