Error tipográfico causa interrupción de 10h en servicio Azure DevOps de Microsoft

Error tipográfico causa interrupción de 10h en servicio Azure DevOps de Microsoft

Microsoft Azure DevOps sufrió una interrupción en su servicio de más de 10 horas en la región sur de Brasil, la cual fue causada por un error tipográfico que eliminó 17 bases de datos de producción. Tras haberse disculpado con los clientes afectados, Microsoft emitió un informe detallado sobre la investigación que se llevó a cabo desde el momento en que se detectó la interrupción, el 24 de mayo a las 12:10 UTC, hasta su solución a las 22:31 UTC del mismo día.

Según Eric Mattingly, gerente principal de ingeniería de software de Microsoft, la actualización de la base de código formó parte del Sprint 222 e incluyó un error tipográfico oculto en el trabajo de eliminación de instantáneas, lo que llevó a eliminar el servidor SQL de Azure en lugar de la base de datos SQL de Azure individual.

Mattingly explicó que cuando se eliminó el servidor SQL de Azure, también se eliminaron las 17 bases de datos de producción de la unidad de escala, aunque confirmó que no se perdió ningún dato durante el proceso accidental.

La interrupción fue detectada en 20 minutos y, a partir de ese momento, los ingenieros de guardia de la empresa comenzaron a trabajar para solucionar el problema. Sin embargo, según el registro de eventos, la causa raíz se identificó a las 16:04, casi cuatro horas después del comienzo de la interrupción.

Microsoft atribuyó el tiempo de solución de más de diez horas al hecho de que los clientes no pueden restaurar los servidores SQL de Azure por sí mismos, así como a las complicaciones de redundancia de copia de seguridad y a un “conjunto complejo de problemas con los servidores web”.

En vista de lo sucedido, Microsoft ha prometido implementar Azure Resource Manager Locks en sus recursos clave para evitar futuras eliminaciones accidentales. No obstante, los clientes de la región estuvieron sin acceso a algunos servicios durante varias horas, lo que destaca la facilidad con la que pueden ocurrir errores y la importancia de tener planes de respaldo para reducir la dependencia de proveedores de servicios únicos, incluyendo el almacenamiento en la nube y otras infraestructuras externas.

Si te interesó esta noticia y deseas mantenerte al día con los últimos acontecimientos, no dudes en explorar nuestras otras secciones en Uni2Noticias. Continúa informándote con nosotros.

Publicaciones Relacionadas

K-dramas emocionantes esta semana: My Demon, Marry My Husband y Welcome to Samdalri. ¡Mantén tus pantallas encendidas!

K-dramas emocionantes esta semana: My Demon, Marry My Husband…

Esta semana, desde el lunes 8 de enero hasta el domingo 14 de enero de 2024, los espectadores pueden esperar ver…
“¿Dónde ver Training Day en línea? Descubre cómo transmitir esta película en streaming”

“¿Dónde ver Training Day en línea? Descubre cómo transmitir…

Si estás interesado en saber dónde ver y transmitir Training Day en línea, has llegado al lugar correcto. Antoine Fuqua dirigió…
Good Trouble Temporada 4 ahora en streaming en Hulu

Good Trouble Temporada 4 ahora en streaming en Hulu

Good Trouble Temporada 4: Disponible para ver en streaming a través de Hulu La Temporada 4 de Good Trouble es la…