Una herramienta de Google pasó de predecir con exactitud los casos de gripe en cada región de EEUU gracias a las consultas del buscador a fallar en todos sus pronósticos. Un artículo en ‘Science’ señala este caso como una parábola de la arrogancia asociada al campo del ‘big data. “Por tener terabytes de datos no tienes mejor información”, señala Esteban Moro
|
etiquetas: big data , flaqueza , google , ciencia , science
- Población totalmente vacunada. Google dice que no hay casos de la gripe.
- Como no hay casos, aparecen los primeros que dicen que no es necesario vacunarse porque la enfermedad ya está erradicada.
- No pasa nada (porque el resto de la población sí lo está, y por tanto el contagio no es posible) y muchos más deciden no vacunarse.
- En poco tiempo, todo el mundo es susceptible de enfermar.
No es un problema con el bigdata, es un problema de pensar que que datos estadísticos pasados son fiables en el futuro aun habiendo un cambio sustancial en el comportamiento.
Otra cosa es que a todo el mundo le gustaría ser Larry Page o Segei Brin, pero llegamos 20 años tarde a eso...
es.wikipedia.org/wiki/Fear,_uncertainty_and_doubt
Parece propio de un periódico de papel dirigido al público general.
Está en portada por que lleva las palabra Google y Big Data
No me ha gustado nada el articulo
#4 Es cierto Big data es una forma de vender de comercial, pero te puedo asegurar que hay bastante mas detrás del análisis de datos que lo que te da la estadística (y que te dan resultados que un análisis estadístico no puede alcanzar ni en sus sueños húmedos).
#10 Eso en aprendizaje automático se llama overfitting
Salu2
Otra cosa distinta es ser capaz de identificar los sesgos que estás introduciendo, y el análisis de #1 es impecable.
Al final lo que pasa con el Big Data es como con todo, que para hacer algo decente hay que currárselo mucho, no es darle a un botón y ya está.
Ahí está lo complicado, por eso la frase “Por tener terabytes de datos no tienes mejor información” no aporta nada nuevo, ni siquiera a Google, que es un experto en sacar aplicaciones que lo que hacen es analizar y aportar valor a la ingente cantidad de datos que dan.
Lo positivo de estos fallos del BigData, si es que lo son, es que la NSA y otras agencias que pretenden analizar y proveer movimientos/revueltas sociales en la red, tampoco van a conseguir sacar gran provecho.
Así que ni pá ti ni pá mi
La cantidad no vale de nada sin la calidad. Y hoy día por culpa de determinadas corrientes filosóficas predominantes, se mete la pata constantemente fiándose de magnitudes puramente cuantitativas y despreciando las cualitativas, lo cual significa hacer caso a un montón de números sin cuestionarse nada más. Números que pueden ser mierda pura y deberse a factores impredecibles (especialmente con automatización de por medio). A partir de cierta escala, hay que trabajar con otros niveles de abstracción y cierta subjetividad, ya que interpretar determinadas cosas es inviable.
Exactamente por la misma razón que un neurocientífico no puede usar directamente los conocimientos de su disciplina para hacer un tratamiento psicológico. Los árboles no dejan ver el bosque.
Lo que decía es que el pillarte una gripe estando vacunado puede ser cierto tanto por el motivo que tu dices (que te tocó la china de un virus que existía un año anterior pero que no pusieron) o por el que digo yo: un virus con una mutación nueva que hace que no existan antígenos.
Haced una cruz con las teclas y podéis levantaros.
Salu2
Se puede hacer un modelo predictivo más fiable si se tienen en cuenta otras variables como los datos oficiales de vacunación, pero son datos que difícilmente vas a conseguir a escala global y en tiempo real.
Que Flu Trends tiene limitaciones para hacer predicciones está clarísimo, pero eso no le resta valor al proyecto. Como decía en mi comentario, el hecho de poder acceder a una estimación global (y desglose por regiones) de los casos de una enfermedad en el presente es acojonante.