SonicMoE a annoncé une étape importante en matière de performance, atteignant un débit maximal sur les GPU NVIDIA Blackwell au 23 avril (UTC+8). Les performances en TFLOPS du passage avant et arrière du modèle dépassent respectivement la référence DeepGEMM de 54 % et 35 %. De plus, il surpasse l'exemple officiel de Triton de 21 % en TFLOPS lors du passage avant. SonicMoE maintient également une empreinte mémoire d'activation minimale, comparable à celle des modèles denses, marquant une avancée notable dans l'efficacité des GPU.