Coinbase hat einen Nachbericht veröffentlicht, der den umfangreichen Ausfall am 7. Mai 2026 detailliert beschreibt, der etwa 8 Stunden dauerte, wobei die vollständige Wiederherstellung etwa 12 Stunden in Anspruch nahm. Der Ausfall wurde durch den Ausfall mehrerer Kühleinheiten in der Availability Zone use1-az4 der AWS-Region us-east-1 verursacht, was zu thermischen Abschaltungen von Server-Racks führte. Dies führte dazu, dass EC2-Instanzen und EBS-Volumes offline gingen, was den Handel, Einzahlungen, Auszahlungen und die Kernservices von Coinbase stark beeinträchtigte. Der Vorfall machte Schwachstellen in der Infrastruktur von Coinbase deutlich, insbesondere die Abhängigkeit von einem einzigen AWS-Rechenzentrum für die Handels-Matching-Engine, die während des Ausfalls den Quorum verlor. Zusätzlich erlitt das von AWS verwaltete Kafka (MSK) einen Kontrollplane-Ausfall, der verschiedene Systeme störte. Coinbase plant, seine regionsübergreifende Architektur zu verbessern, die Katastrophenwiederherstellungsprotokolle zu optimieren und mit AWS zusammenzuarbeiten, um diese Probleme zu beheben und zukünftige Vorfälle zu verhindern.