Coinbase ha publicado un informe post-mortem detallando la extensa interrupción del servicio ocurrida el 7 de mayo de 2026, que duró aproximadamente 8 horas, con una recuperación completa que tomó alrededor de 12 horas. La interrupción fue causada por la falla de múltiples unidades de enfriamiento en la Zona de Disponibilidad use1-az4 de la región us-east-1 de AWS, lo que llevó a apagados térmicos de los racks de servidores. Esto resultó en que las instancias EC2 y los volúmenes EBS quedaran fuera de línea, afectando gravemente las operaciones de trading, depósitos, retiros y servicios centrales de Coinbase. El incidente puso de manifiesto vulnerabilidades en la infraestructura de Coinbase, particularmente su dependencia de un único centro de datos de AWS para su motor de emparejamiento de trading, que perdió el quórum durante la interrupción. Además, Kafka gestionado por AWS (MSK) experimentó una falla en el plano de control, interrumpiendo varios sistemas. Coinbase planea mejorar su arquitectura entre regiones, optimizar los protocolos de recuperación ante desastres y colaborar con AWS para abordar estos problemas y prevenir futuras ocurrencias.