Un nuevo fallo en una empresa CDN ha dejado esta semana internet patas arriba. Fastly es la compañía de la que ha surgido la caída de las páginas de Amazon, Twitch, Reddit o CNN.
Es habitual que la conexión a internet de algún problema, algo que se soluciona rápidamente y que deja caída alguna página o red social, pero tantas ni tan importantes al mismo tiempo. Por eso surgía la alarma y las redes se llenaban de comentarios. BBC, Pinterest, The Financial Times o Reddit eran algunas de las afectadas.
Durante un tiempo se especuló con un ataque, incluso se habló de un fallo por parte de servidores como los de Amazon, pero en realidad el problema había surgido de una CDN (Content Delivery Network), la compañía Fastly. Estas empresas trabajan para llevar el contenido de determinadas páginas a todo el mundo de forma más rápida y son una protección ante algunos fallos, pero no son infalibles.
En realidad, este tipo de errores simultáneos causados por una CDN no son nuevos. Cloudflare, competidor directo de Fastly, ya ha protagonizado más de uno. En 2019 aparecía el temido 502 en las pantallas de millones de ordenadores y móviles, Cloudflare tenía un problema y había dejado sin servicio a muchas páginas.
Mientras Cloudflare se enfoca a pequeñas y medianas empresas de internet, Fastly está enfocado a dar soporte a grandes compañías por todo el mundo, por eso ha sido más sonado este fallo. Esta CDN ha explicado que el fallo fue activado por error por un cliente de la compañía desencadenando una caída masiva en las demás páginas con las que trabaja la empresa. El fallo llevaba un mes oculto y no fue hasta que se activó cuando los informáticos de la empresa lo detectaron.
El papel de los CDN es el de replicar las webs de sus clientes, su diseño, imágenes y demás elementos por todos los servidores que tiene repartidos por el mundo. La web de The Financial Times nace en Estados Unidos y para llegar al otro extremo del mundo con la menor latencia hace falta replicarla en un centro más cercano.
Además de reducir tiempo de carga para todos los usuarios del mundo, se disminuye la posibilidad de un fallo. Si algo no funciona bien en un servidor, los usuarios de una zona pueden acceder al segundo centro más cercano y verse afectados, es una red de seguridad. Pero si el fallo afecta a la estructura de esa red, todo se cae como un castillo de naipes.
Fastly perdió el 85% de su red, afortunadamente pudieron recuperar la estructura pasadas unas horas. No obstante, el tiempo requerido y la cantidad de páginas afectadas revela dos cosas: que el fallo fue considerable, un agujero importante en la estructura, y que hay una concentración muy alta en este mercado por el que muchas empresas dependen de un solo proveedor.
Daba igual que estas compañías utilizarán servidores de Amazon (AWS), Azure o Google Cloud, Fastly las arrastró a todas. Incluso Amazon falló cuando es una empresa que cuenta con su propio CDN, pues la compañía de Jeff Bezos prefiere descentralizarse para no agravar más las consecuencias de un fallo en sus servicios.
Ante un un problema como el vivido esta semana, los usuarios no podemos hacer gran cosa, salvo esperar a que la empresa dé con la solución. Ser pacientes y consultar de vez en cuando las redes sociales de estas compañías donde suelen informar del avance del problema.