Coinbase a publié un rapport post-mortem détaillant la panne de service majeure survenue le 7 mai 2026, qui a duré environ 8 heures, avec une récupération complète prenant environ 12 heures. La panne a été causée par la défaillance de plusieurs unités de refroidissement dans la zone de disponibilité use1-az4 de la région AWS us-east-1, entraînant des arrêts thermiques des racks de serveurs. Cela a provoqué la mise hors ligne des instances EC2 et des volumes EBS, impactant sévèrement les services de trading, de dépôts, de retraits et les services principaux de Coinbase. L'incident a mis en lumière des vulnérabilités dans l'infrastructure de Coinbase, notamment sa dépendance à un seul centre de données AWS pour son moteur de correspondance des transactions, qui a perdu le quorum pendant la panne. De plus, Kafka géré par AWS (MSK) a subi une défaillance du plan de contrôle, perturbant divers systèmes. Coinbase prévoit d'améliorer son architecture inter-régions, de renforcer ses protocoles de reprise après sinistre et de collaborer avec AWS pour résoudre ces problèmes et prévenir de futures occurrences.