Anuncios: Resumen Incidente 05 Febrero - Arizona DC

Publicado: 05/02/2025

Hoy (05 Febrero) ha sido un día muy movido.

Nos vimos enfrentados a un problema de red a nivel internacional, que intentamos explicar en las comunicaciones con nuestros clientes, pero aparte de ser algo técnico, se dificulta, cuando afecta a varios servidores y son cientos de clientes afectados.

Hacemos esta publicación, por que fueron cerca de 1.000 clientes afectados de nosotros (y otros varios miles que no son clientes nuestros).

El problema de hoy, afectó por cerca de 1 hora a nuestros servidores en Arizona, la que es hasta hoy, nuestra red más estable y con mejor Uptime. Y lo sigue siendo, ya que tecnicamente el Servidor siguió Online, y solo algunos ISP de Chile/Brazil tuvieron inconvenientes.

¿Cual fue el problema?

Cerca de las 15:20 Hora Chile, recibimos los primeros reportes de clientes que no podían ver sus sitios, aun cuando el monitor mostraba que el servidor estaba Online desde 6 ubicaciones distintas (a ratos 5, ya que Brazil fallaba intermitentemente).

Se hicieron diversas pruebas y rapidamente identificamos que los Servidores estaban Online y accesibles, los sitios funcionaban y los correos se recibían.

El problema estaba especificamente en un punto de Brazil, en Sao Paulo. la red en ese lugar estaba con graves problemas y perdida de paquetes, algo externo a nosotros.

¿Si estaba el problema en Brazil, por que muchos clientes en Chile no podían ver sus sitios?

En nuestras pruebas, notamos que algunos ISP de Chile (VTR Si, Entel No, por ejemplo), prefieren la ruta que va por Brazil (A través del ISP Hurricane Electric) para llegar a ciertas partes de Estados Unidos, más especificamente al estado de Phoeniz, Arizona, donde tenemos varios servidores.

¿Quien se vio afectado?

Algunos cientos de nuestros clientes que su ISP iba por Brazil, con sitios en los Servidores DA005-DA006-CP001-CP003-CP007-CP008-CP010-CP011-CP014-CP016.
Hartos. Y muchos miles más fuera de nuestros servidores.

¿Cuanto duró el Incidente?

Aproximadamente 1 hora. a las 16:20 PM logramos hacer modificaciones en nuestra Red en Arizona, para descartar toda conexión que utilizara la red de "Hurricane Electric" en Brazil. Esta medida logramos tomarla ya que tenemos cierto control de la red utilizada en Arizona, por la cantidad de Servidores, lo que nos permitió cambiar la ruta, y así, que nuestros servidores no nos afectara el problema de la red en Brazil de ahi en adelante.

¿Que medidas se tomaron?

Aparte de lo mencionado anteriormente, logramos tomar contacto con el soporte de Hurricane Electric en Brazil, en una primera instancia nos indicaron que no tenían ninguna incidencia o problema.

Finalmente obtuvimos la linea de emergencia de Hurricane Electric, donde les hicimos notar del problema de conexion en Brazil, y que causaba problemas a conexiones desde Chile a USA, imaginamos ya sabían, pero nos pidieron varias pruebas y evidencias provistas por nosotros, esta comunicación empezó cerca de las 16:12 y a las 16:33, nos confirmaron que tenían problemas de red en Brazil, y que se saltarían esa conexion desde Chile (es decir, en lugar de que fuese Chile-Argentina-Brazil-USA, pasaría a ser Chile-Argentina-Miami USA). Esta fue la solución definitiva por parte de ellos, y que debería haber tambien solucionado el problema para los miles de sitios con problemas que estaban fuera de premiumhosting. Nos alegra haber ayudado.

Publicamos este reporte, ya que este problema especifico afectó a muchos de nuestros clientes, aun cuando nuestros servidores y nuestra red funcionaba sin problemas, es necesario para ahondar y detallar un poco más como funciona el internet. Finalmente la conexion a internet, no es más que un cable, un cable de miles de kilometros desde tu computador (o router) hasta el Servidor en Estados Unidos, en España o en China, de la página que estas visitando (si, el cable cruza los océanos), y un problema a miles de kilometros, puede impedir que veas tu página, o facebook, o que whatsapp se caiga a nivel mundial, etc.

Estamos todavía trabajando en los correos, chats y tickets que se acumularon por el incidente, agradecemos la paciencia en estas proximas horas.