SonicMoE ha anunciado un hito significativo en rendimiento, alcanzando un rendimiento máximo en las GPUs NVIDIA Blackwell a partir del 23 de abril (UTC+8). El rendimiento en TFLOPS del pase hacia adelante y hacia atrás del modelo supera la línea base DeepGEMM en un 54% y 35%, respectivamente. Además, supera el ejemplo oficial de Triton en un 21% en TFLOPS del pase hacia adelante. SonicMoE también mantiene una huella mínima de memoria de activación, comparable a la de modelos densos, marcando un avance notable en la eficiencia de las GPU.