Le Décodage Spéculatif Décentralisé (DSD) est apparu comme un cadre révolutionnaire pour améliorer l'inférence des grands modèles de langage (LLM) sur des réseaux distribués. Intégré à Parallax, le DSD relève le défi de la latence de communication entre les nœuds, qui ralentit traditionnellement la génération de tokens. En transformant la latence en une bande passante de calcul supplémentaire, le DSD atteint une augmentation du débit de 2,6× et une réduction de 37 % de la communication, le tout sans compromettre la précision. Le DSD introduit deux innovations clés : le Décodage par Règlements par Lots et la Vérification Adaptative. Le Décodage par Règlements par Lots réduit les goulots d'étranglement liés à la synchronisation en regroupant plusieurs tokens en un seul cycle de vérification, tandis que la Vérification Adaptative optimise la validation des tokens en fonction de leur importance, améliorant la vitesse de 15 à 20 % sans perte de qualité. Ces avancées permettent un débit plus élevé et une dépendance réduite à la latence WAN, faisant du DSD un outil puissant pour des tâches telles que le raisonnement d'agents et la génération de code à travers des clusters distants.