SonicMoE a annoncé une étape importante en matière de performance, atteignant un débit maximal sur les GPU NVIDIA Blackwell au 23 avril (UTC+8). Les performances en TFLOPS du passage avant et arrière du modèle dépassent respectivement la référence DeepGEMM de 54 % et 35 %. De plus, il surpasse l'exemple officiel de Triton de 21 % en TFLOPS lors du passage avant. SonicMoE maintient également une empreinte mémoire d'activation minimale, comparable à celle des modèles denses, marquant une avancée notable dans l'efficacité des GPU.
SonicMoE atteint des performances record sur les GPU NVIDIA Blackwell
Avertissement : Le contenu proposé sur Phemex News est à titre informatif uniquement. Nous ne garantissons pas la qualité, l'exactitude ou l'exhaustivité des informations provenant d'articles tiers. Ce contenu ne constitue pas un conseil financier ou d'investissement. Nous vous recommandons vivement d'effectuer vos propres recherches et de consulter un conseiller financier qualifié avant toute décision d'investissement.
