Eran poco más de las 8 de la mañana en Londres cuando el gobierno británicoLos sitios web comenzaron a parpadear y desvanecerse.
La mayor parte de Estados Unidos estaba dormida, pero algunos noctámbulos en la costa este encontraron estancados sus servicios de transmisión de Disney.
Quienes llamaban a Lyfts para volver a casa después de una fiesta del domingo por la noche tenían dificultades. Las actividades rutinarias se estaban paralizando.
Cuando el este de Estados Unidos despertó, la magnitud del problema quedó clara.
United Airlines y Delta descubrieron que sus pasajeros no podían utilizar los servicios en línea. Los viajeros acostumbrados a escanear el New York Times‘El boletín matutino se quedó sin él. Los Snapchatters guardaron silencio; Reddit Los foros estaban en silencio.
Un tercio de todos los usuarios en línea en todo el mundo interactúa diariamente con Amazon Web Services (AWS), según DeepField Networks: empresas que van desde Venmo hasta Reddit y Ring, todos dependen de servidores AWS. Y el lunes por la mañana el sistema no funcionaba. colapsando una parte importante de Internet.
El hecho de que tal interrupción pueda ocurrir es “sorprendente”, dijo el experto en ciberseguridad James Knight, director senior de Guerra digitalque ayuda a las empresas a identificar y reforzar las vulnerabilidades en línea. También es un indicador preocupante de un nuevo tipo de caos del que ninguno de nosotros es inmune.
Knight le dijo al Daily Mail: ‘Lo primero que pensé fue preguntarme cómo pudo ocurrir esto. Al parecer, algún tipo de base de datos se cayó.

Un tercio de todos los usuarios en línea en todo el mundo interactúan diariamente con Amazon Web Services (AWS), según DeepField Networks: empresas que van desde Venmo hasta Reddit y Ring dependen de los servidores de AWS. Y el lunes por la mañana el sistema no funcionaba.
‘Es sorprendente que algo haya afectado su red, porque normalmente hay copias de seguridad y sistemas redundantes ejecutándose al mismo tiempo. La caída de un sistema en particular es muy, muy sorprendente”.
Knight admitió que estaba desconcertado por la interrupción que, según señaló, le habrá costado a Amazon cientos de millones de dólares.
Comenzó a las 3:11 am ET. A las 5:01 am ET, se identificó el problema y se implementó una “solución” en 20 minutos.
Sin embargo, el problema seguía sin resolverse y, a las 8:48 a.m. ET, Amazon emitió otra actualización diciendo que se estaban llevando a cabo más correcciones.
Inevitablemente se ha planteado el espectro de un ciberataque, pero, según Knight, esto es poco probable.
Explicó: “Un ciberprofesional como yo, o quienquiera que esté examinándolo actualmente, podría ver si se trata de un hack”. Se llama una indicación de compromiso, un COI.
‘Quizás veríamos una firma de malware; algún tipo de acceso no autorizado; algo en los registros muestra que se obtuvo algún tipo de acceso o tráfico anómalo. No hay nada que indique eso aquí.
Es más, dijo, Amazon está legalmente obligado a revelar cualquier hackeo.
En cambio, la compañía ha dicho que el problema deriva de su sitio en Virginia, conocida como la región US-EAST-1.
Su última gran interrupción fue en 2021, una señal, dijo Knight, de la resistencia real de los sistemas de AWS. Pero los problemas, cuando ocurren, pueden ser devastadores.
En julio de 2024, la empresa de ciberseguridad CrowdStrike cerró, provocando la mayor interrupción de TI de la historia.
El problema en sí duró menos de 90 minutos, pero algunas empresas tardaron días en recuperarse. Una aseguradora calculó que el problema costó a las empresas Fortune 500 más de 5 mil millones de dólares en pérdidas directas, siendo las aerolíneas y los hospitales los más afectados.
La empresa de telecomunicaciones AT&T encontró que su red no estaba disponible varias veces el año pasado, con una falla particularmente dañina de 11 horas en febrero.
Knight dijo que es una señal de los tiempos y algo con lo que simplemente tenemos que aprender a vivir.

En la imagen: un centro de datos de Amazon Web Services en Virginia

En la imagen: los informes de Downdetector sobre interrupciones de AWS aumentaron

Knight dijo que los cortes de Internet son una señal de los tiempos y algo con lo que tenemos que aprender a vivir.
“Nuestras vidas están en línea y esto simplemente va a suceder”, afirmó. ‘AWS, junto con Google y Microsoft, son el estándar de oro en computación en la nube. Así que no es que los rivales de AWS se sientan satisfechos, porque mañana les podría pasar a ellos.
‘Realmente no puedo criticar a AWS. Reaccionaron bastante bien. No sé si a alguien le va a dar vueltas la cabeza, pero se lo tomarán muy en serio y creo que sacarán las lecciones aprendidas para poder mejorar”.
Sin embargo, dado el ferozmente competitivo espacio de la computación en la nube, AWS no compartirá sus soluciones con sus rivales.
¿Significa esto que las empresas de hoy tienen demasiados huevos en la misma canasta? ¿Deberían distribuir sus servicios utilizando más de una empresa de computación en la nube?
Knight dijo que en teoría podrían hacerlo, pero que sería difícil de administrar y no necesariamente útil.
“AWS ya está dividido en varias cestas y es por eso que la gente mantiene las cosas en la nube”, afirmó. “Algunos de sus servidores están en la nube en un lugar y otros en otro: algunos en la costa este de EE. UU., algunos en la costa oeste, algunos en Asia y están repartidos por todas partes”.
A las 11:43 am ET del lunes, más de ocho horas después de la primera señal de problemas, Amazon parecía optimista de que el final estaba a la vista.
“Hemos reducido la fuente de los problemas de conectividad de red que afectaron a los servicios de AWS”, dijo la compañía. “La causa principal es un subsistema interno subyacente responsable de monitorear el estado de nuestros balanceadores de carga de red”.
Dijeron que estaban ralentizando deliberadamente algunos servicios “para ayudar a la recuperación” y que todavía estaban “trabajando activamente en las mitigaciones”.
Knight dijo que Amazon estudiaría en detalle qué salió mal y aprendería lecciones de la interrupción.
“Van a determinar la causa raíz”, dijo. “Y luego van a mejorar sus procedimientos”.
“Saldrán más fuertes de esto”, dijo, y harán todo lo posible para garantizar que no vuelva a suceder.
Pero la verdad con la que todos tendremos que vivir es: así será. Y la próxima vez podría ser aún peor.