El lunes 20 de octubre de 2025, millones de personas en todo el mundo se despertaron con una sorpresa nada agradable. Snapchat no respondía. Fortnite estaba caído. Hasta Alexa se quedó sin palabras (literalmente).
¿La razón? Amazon Web Services, el gigante invisible que sostiene buena parte del internet tal como lo conocemos, sufrió un apagón masivo que duró más de nueve horas.
El origen del problema
Todo comenzó cerca de las 3:00 am hora del este de Estados Unidos, cuando AWS reportó «tasas de error elevadas» en su región US-EAST-1, ubicada en el norte de Virginia. Este centro de datos es el corazón pulsante de AWS, el más antiguo y grande de toda su red.
El fallo estaba en el sistema de nombres de dominio (DNS), ese mecanismo invisible que convierte las direcciones web que escribimos en navegadores en las direcciones IP que las computadoras entienden. Sin él, es como si le quitaras el GPS a toda la internet.
AWS explicó que el problema se originó en un subsistema interno encargado de monitorear la salud de sus balanceadores de carga de red, esos sistemas que distribuyen el tráfico entre varios servidores para asegurar que todo funcione sin problemas.
Cuando este subsistema falló, provocó un efecto dominó que tumbó servicios uno tras otro.
Las víctimas del apagón
La lista de afectados fue impresionante. Snapchat registró más de 22,000 reportes de usuarios en su peor momento. Reddit, Roblox, Venmo, Duolingo, PayPal, Robinhood, Coinbase… todos quedaron fuera de servicio.
Pero ahí no terminó la cosa. Los propios productos de Amazon también se cayeron. Prime Video dejó de transmitir, Alexa no respondía comandos, y los timbres inteligentes Ring se quedaron mudos. Incluso el sitio de compras de Amazon experimentó problemas.
En el Reino Unido, bancos como Lloyds y Bank of Scotland reportaron interrupciones, al igual que operadores de telecomunicaciones como Vodafone y BT. La autoridad fiscal británica (HMRC) también vio caer su sitio web.
Según Ookla, dueña de Downdetector (el sitio donde la gente reporta caídas de servicios), más de 4 millones de usuarios informaron problemas debido al incidente. Se estima que al menos mil empresas fueron afectadas.
Una recuperación lenta y con altibajos
AWS comenzó a mostrar señales de recuperación alrededor de las 6:35 am hora del este, cuando reportó que el problema de DNS había sido «completamente mitigado». Sin embargo, la cosa no fue tan sencilla. A medida que avanzaba el día, algunos servicios volvían a presentar problemas.
Para la 1:00 pm hora del este, AWS seguía luchando con errores elevados en varios de sus servicios. Lambda, uno de sus servicios de computación más importantes, continuaba experimentando errores debido a problemas en un subsistema interno.
La empresa reconoció que estaba tomando medidas para recuperar estos sistemas y que algunos centros de datos ya mostraban mejoras, pero evitó dar una línea de tiempo específica para la resolución completa.
¿Por qué US-EAST-1 es tan importante?
Si te preguntas por qué un centro de datos en Virginia puede causar tanto caos, la respuesta es bastante sencilla. US-EAST-1 no es un centro de datos cualquiera. Es el más antiguo de AWS, inaugurado en 2006, y con frecuencia se configura como la región predeterminada para muchos servicios de Amazon.
Esta ubicación alberga infraestructura global que alimenta servicios fundamentales de internet, como Route 53 (un controlador de tráfico de internet) y Amazon CloudFront (un servicio de conexión segura).
Básicamente, incluso si una empresa decide no procesar sus datos en US-EAST-1, es probable que alguna parte de su cadena de suministro digital pase por ahí.
La región tiene un historial accidentado. Ya había sufrido apagones significativos en 2021 y 2020. A pesar de esto, sigue siendo el hub predeterminado para innumerables servicios.
La fragilidad de nuestra infraestructura digital
Este apagón puso de manifiesto algo que muchos expertos llevan años advirtiendo: nuestra dependencia de un pequeño número de proveedores de nube es un riesgo enorme.
«Este apagón una vez más resalta la dependencia que tenemos de infraestructuras relativamente frágiles«, señaló Jake Moore, asesor global de ciberseguridad de la firma europea ESET.
AWS es el líder indiscutible del mercado de servicios en la nube, seguido por Microsoft Azure y Google Cloud. Cuando uno de estos gigantes cae, las consecuencias se sienten en todo el planeta.
Nishanth Sastry, director de investigación del Departamento de Ciencias de la Computación de la Universidad de Surrey, lo explicó con claridad: «La razón principal de este problema es que todas estas grandes empresas han confiado en un solo servicio«.
Para las empresas, las consecuencias van más allá de la molestia. «Para los negocios importantes, horas de inactividad en la nube se traducen en millones en pérdida de productividad e ingresos«, advirtió Ryan Griffin, líder de práctica cibernética en Estados Unidos de la firma de seguros McGill and Partners.
Fuente: BBC