Anuncios: Resumen Incidente 09 Septiembre - Servidor CP007

Publicado: 10/09/2024

Informe de Incidente Servidor CP007 Texas, 10 Septiembre 2024.

INFORME RESUMIDO (Actualizado 10 Sept 08.00):
El Servidor Cpanel CP007 en Texas tuvo una falla fatal el dia 09 Septiembre 2024, cerca de las 05AM Chile.
Se hicieron todos los procesos posibles por recuperar acceso, sin éxito
Se inició el proceso de restauracion de emergencia desde nuestros respaldos entre las 11:30 AM del Lunes 09 de Septiembre y las 18:00 PM del mismo dia, con éxito
Si usas nuestros DNS no debes hacer cambios.
Si usas DNS Externos o CloudFlare, debes actualizar la IP a 162.213.209.162
Si tu sitio presenta un error fatal o critico, puedes probar bajando la version de PHP de 8.1 a 7.4, o avisarnos para ayudarte.
Se sabe de algunas casillas de correo que no cargan, debe ser solucionado por nosotros, nos debes contactar a [email protected] para una rapida solucion.
Hay una perdida de informacion desde el Domingo 22:00 al Lunes 05:00 AM.

Para dudas o soporte, problemas o lo que sea, no esperes y escribe a [email protected] .
El dia 10 de Septiembre (Martes) se aplicará una extensión de 1 mes a todos los servicios en el Servidor CP007. Esta extensión es automatica sin necesidad de solicitarla.



INFORME DETALLADO:
El dia 09 de Septiembre, cerca de las 05:00 Horas Chile, el Servidor CP007 en TX, presentó una desconexión de 1 minuto, alertada por nuestro Monitor de Uptime.
Sin embargo el primer reporte de problemas fue recibido cerca de las 07:30 AM. De inmediato comenzamos los procesos regulares para recuperar la conexion normal al Servidor, sin exito. Cerca de las 09:00 AM un Tecnico del Datacenter fisicamente inspecciona y realiza mantenimiento al Servidor, nuevamente sin éxito.
El problema se escala y hacen revisiones de hardware, en donde se identifica un fallo grave en la placa madre del Servidor.

El mismo 09 de Septiembre Horas Chile, comenzamos nuestro proceso de Emergencia.

Nuestro Proceso de emergencia, está pensando para una catastrofe, una falla fatal de un Servidor, un Incendio, o cualquier caso extremadamente grave, en donde un Servidor nuestro es irreparable, o su reparación/revisión puede tardar más de 24horas.

Cerca de las 11:30 AM, el Proceso de restauración comienza, en donde vamos cuenta por cuenta, restaurando desde nuestros respaldos más recientes que son del dia Domingo 08 de Septiembre entre 21 y 23 hrs.

Durante toda la mañana y tarde, logramos hacer el proceso de restauración de todas las cuentas de nuestros clientes afectados en el Servidor, sin embargo, siempre en estos procesos masivos, quedan cuentas que fallaron o que levantaron alertas y deben ser revisadas manualmente y en detalle, archivos, correos y bases de datos.

Durante la tarde-noche del Dia Lunes 09 hicimos la revisión, reparación o restauración de cerca de 20 cuentas que levantaron alertas, asegurandonos de dejar todas las cuentas funcionando correctamente.

Puntos Importantes:
1- El Servidor nuevo es el CP014, cuya versión de PHP por defecto es más nueva, es la 8.1 . Por lo que si tu sitio es antiguo y da error, puedes bajar la version de PHP a 7.4 en el Cpanel, o mejor aún, puedes contactarnos y revisaremos tu sitio para arreglarlo sin problemas.
2- Los DNS se mantienen, si usabas nuestros DNS, tus correos y sitios siguen funcionando.
3- Si usas DNS Externos o CloudFlare, debes actualizar la IP a la nueva que es 162.213.209.162
4- Si eres un Reseller y usas DNS Personalizados, debes actualizar las IPs a 162.213.209.162
5- El Servidor CP014 tendrá una carga alta por unos pocos dias, mientras levantamos un nuevo Servidor y migramos las cuentas más pesadas y consumidoras de CPU al nuevo Servidor. Esto se hará estos dias de esta misma semana.


Actualizacion Final:

Debido a este Incidente, hemos procedido a extender todos los Servidores del Servidor CP007 1 mes, a modo de compensación por el tiempo offline. Esto se hará durante el dia de hoy, 10 de Septiembre.