SonicMoE hat einen bedeutenden Leistungserfolg bekannt gegeben und erreicht seit dem 23. April (UTC+8) eine Spitzen-Durchsatzrate auf NVIDIA Blackwell GPUs. Die TFLOPS-Leistung des Modells bei Vorwärts- und Rückwärtsdurchläufen übertrifft die DeepGEMM-Basislinie um 54 % bzw. 35 %. Darüber hinaus übertrifft es das offizielle Triton-Beispiel bei der TFLOPS-Leistung im Vorwärtsdurchlauf um 21 %. SonicMoE hält zudem einen minimalen Aktivierungsspeicherbedarf, vergleichbar mit dichten Modellen, was einen bemerkenswerten Fortschritt in der GPU-Effizienz darstellt.