edición general
301 meneos
 

Apagón de GMAIL: disculpas y explicaciones de qué pasó [ENG]

Explicación oficial del apagón en GMAIL del martes 24 de Febrero. El problema surgió cuando se mantenían tareas de mantenimiento en uno de los centros de Google en Europa...

| etiquetas: gmail , fallo , explicaciones
160 141 4 K 673 mnm
160 141 4 K 673 mnm
  1. Lots of folks are asking what happened, so we thought you'd like an explanation. This morning, there was a routine maintenance event in one of our European data centers. This typically causes no disruption because accounts are simply served out of another data center.
    Claro , la culpa de Europa :-P
  2. #2 si hubiera sido así hasta hace unas horas no se habría resuelto el problema. El hecho es que yo empecé a tener fallos a las 11am de ayer y a las 13.00 ya funcionaba bien.
  3. Traduzco lo esencial, la parte en que dan realmente explicaciones, por si a alguien le sirve.

    Esta mañana teníamos una operación rutinaria de mantenimiento en uno de nuestros centros de datos europeos. Esto normalmente no causa ningún transtorno, porque simplemente las cuentas se sirven desde otro centro de datos.

    Inesperados efectos colaterales de unos códigos nuevos que tratan de mantener los datos geográficos más cerca del usuario provocaron la sobrecarga de otro de los centros de datos de Europa, y eso provocó problemas en cascada de un centro de datos a otro. Nos llevó alrededor de una hora recuperar el control sobre todos ellos.

    Los bugs han sido encontrados y reparados, y estamos en el proceso de impulsar unos cambios. Sabemos lo dañino que puede ser un apagón como este (nosotros corremos Google en Gmail, así que apagones como este nos afectan del mismo modo que a vosotros). Siempre investigamos las causas de origen de apagones como este, de modo que podamos prevenir problemas similares en el futuro.
  4. La he liao parda mode xD
  5. ¿Cual era el boton que no tenía que tocar?
  6. "se mantenían tareas de mantenimiento..."

    y el mantenedor que las mantenga, buen mantenedor será :-D

    #0 "se llevaban a cabo", "se realizaban", "tenían lugar", "se efectuaban"...
  7. #2: ¿por qué no pones la frase completa y la siguiente?

    "Durante dos horas y media empezando a las 1.30 hora del Pacífico (donde está la sede de Google, añado yo), mientras muchos de nuestros usuarios en EEUU dormían, mucha gente no pudo acceder a su correo. Gran cantidad de usuarios por todo el mundo que dependen de Gmail fueron interrumpidos en sus horas de actividad y trabajo, y lo sentimos".

    La verdad, a veces el antiamericanismo roza el ridículo. Más aún cuando este problema parece que viene de un intento de descentralizar.
  8. Yo me cague, pensaba que era un golpe de estado mundial de google. Vamos, un 24F xD
  9. Claro, asi que la culpa es de los de testing, no? por no encontrar el bug antes de llevarlo a produccion >:-( [/tester]
  10. esta se la paso porque no me afectó directamente, en el tiempo que permanecio caído no lo utilicé
  11. Disculpas aceptadisimas, vamos, al menos te cuentan lo que pasa. No es como lo típico de "¿a ti te va el messenger?" que nunca sabias que habia pasado xD
  12. ¿Así es como piensan convencer a las empresas para que se pasen a google apps?
    Ha sido una caída muy breve pero suficientemente larga para ver que para Google dar información a sus clientes equivale a meter una nota en su blog al día siguiente.
    Esto de la nube veremos si no acaba siendo más bien humo.
  13. k cabron mientra enviava un gran decumento lo perdiy lo tuve k repeti las 100 paginas k llevava de esta se acuerda!!!!! grrrrrrr

    aleeee!!!!!!
  14. #19 Si el documento lo habías redactado tu, creo que el problema fué que el corrector ortográfico de google, se cepillo los recursos de todos sus centros de datos en corregirlo ... ;)
  15. Os habeis fijado pero, la de problemas que están teniendo desde que hicieron regulación del personal... se estan quemando ahora.. :-/
  16. #6 eso me recordo el status en twitter que mando un excompañero de trabajo, me parecio bastante gracioso -> twitter.com/polecito/status/1244589052
  17. #20 si puede ser pero son unos hijos de.............. y no molaaaa:D
  18. ¿Esta vez sí se podrá decir? "Ha sido un fallo informático"

    (¿O será culpa del becario de turno?) :-D
  19. Categoria "Caidas de google" ya!
  20. ¿Acacio Cruz? No me esperaba ese nombre del Gmail Site Reliability Manager

    ¡Y nada contra los Acacios, eh!
  21. Esto acerca Gmail a Hotmail
  22. Lo siento, pero no me lo creo, los detalles que da google en el blog, son poco menos que insignificantes, no hay nada tecnico en ellos que me haga creerme su explicacion.

    1 Al principio del apagon cuando intentabas entrar se producia en time up
    2 El ping respondia puesto que los servidores de google estan puestos en balanceo de carga
    3 Si realizabas un telnet al puerto smpt de gmail esta respondia perfectamente con el hello
    4 Los protocolos pop3 y imap funcionaban perfectamente puesto que muchos usuarios pudieron descargar sus correoss por ellos.
    5 El problema estaba en el "front end" de la aplicacion web, el cual no estaba caido porque respondia perfectamente a solicitudes get y post

    Lo siento llamarme paranoico pero me inclino a que el problema es que recibio un ataque DOS distribuido, y si buscais por la red vereis que no soi el unico que piensa en ello.
  23. #28 No entiendo la mitad de lo que escribes, pero entiendo que en cierto modo era un DDOS provocado por el propio sistema; si tienes dos datacenters en Europa, y desconectas uno, y en vez de repartir el tráfico al resto del mundo, envías todo el tráfico al otro datacenter de Europa (por el algoritmo ese de enviarlo al más cercano) tendría toda la pinta de un DDOS sobre ese datacenter. (Y todo respondería a las peticiones, pero no respondería el datacenter sobrecargado; que creo son los síntomas que describes.)
  24. #28, claro que recibió un DDOS, pero de los propios usuarios.
    En este caso no es necesario buscar hadas en el bosque.

    Según indica #5, entiendo, que los datos geográficos servían para aproximar el tráfico al datacenter más cercano. Si el algoritmo fallaba y daba siempre el mismo datacenter, pues DDOS al canto.
  25. #28 Cuidado ¡te vigilan! El canal ya no es seguro
comentarios cerrados

menéame