Actualidad y sociedad
144 meneos
3896 clics
Por qué las estadísticas oficiales sobre el coronavirus son necesariamente incorrectas [ENG]

Por qué las estadísticas oficiales sobre el coronavirus son necesariamente incorrectas [ENG]

Si bien hay preguntas sobre si estas estadísticas son ciertas o no, las personas no aprecian el hecho de que estas estadísticas no son como las otras estadísticas que encuentran. Estas estadísticas pertenecen a una clase de estadística completamente diferente. Esto termina teniendo grandes consecuencias desde una perspectiva estadística y práctica. Errores simétricos vs errores asimétricos.

| etiquetas: números , coronavirus , wuhan , errores simétricos , errores asimétricos
66 78 2 K 247
66 78 2 K 247
  1. Los datos que abren el artículo son antiguos (25 de enero) pero el análisis del artículo sigue siendo actual porque no se centra tanto en los números concretos sino en por qué los números oficiales no sirven como estimaciones.
    Sobre el titular; he combinado el titular con el segundo titular.
  2. Me viene a la cabeza.... lo copio:

    una cita que se le atribuye al Primer Ministro del Reino Unido, Benjamín Disraeli o al escritor Mark Twain. Venia a decir algo así: Hay tres tipos de Mentiras: Las Mentiras, las Malditas Mentiras y las Estadísticas
  3. Sólo me fío de las estadísticas que he manipulado.
  4. #3 Mejor esta de aquella.
    _____________________________________

    Rel.: www.meneame.net/c/28758430
    cc @Ojorojo
  5. Para mi la clave es esto:
    It is very difficult to detect asymptomatic carriers and very difficult to account for people who have not reported their symptoms to the authorities
    El resto es estadística básica.
  6. #5 mi comentario se puede interpretar de ambas maneras. Pero tienes razón.
  7. #7 Hoy he estado con un programa que no tenía muy claro lo de origen y destino... me lo ha pegado. :-D
  8. #8 no, si tu interpretación es la que yo quería decir, pero si uno se fija se puede leer de ambas maneras. Mi día ha sido un asco. Además ya acabé "El libro del Día del Juicio Final" libro que empecé "proféticamente"* el 6 de enero y ahora no sé qué leer. Empecé Alas nocturnas de Silverberg pero me está aburriendo soberanamente y otro de relatos de Aldiss igual...

    *casualmente va de una epidemia de gripe y otras epidemias (el título es un tanto engañoso es de sci-fi/novela histórica).
  9. #10 ah. Buscaré Todos sobre Zanzíbar que he leído que es difícililla.
  10. #0 #5 #6 Y esto:

    When people say that the official figure is an underestimate, they forget this: the official figure isn’t an estimate for the true number of cases. The official figure isn’t even trying to estimate the true number of cases, because it will be wrong anyway. It only reports the number of confirmed cases. The number of suspected and quarantined cases are also reported — these figures are the ones to focus on, to get a better idea of the situation. And even though these figures could still be misleading, it seems like people are not necessarily misled by these figures. People act fearfully and take precautions that seem unnecessary, but they know intuitively that the reported numbers are not the true numbers. This is why face masks are selling out in China right now — they know the true figures are worse and they are preparing for it.
  11. #13 Y yo me tiro a la piscina y digo que la cifra está subestimada.
  12. #14 Es que efectivamente está infraestimada (no digo que 44000 no parezca inflado - aunque los epidemiólogos algo habrán estudiado - pero decenas de miles seguro, por pura lógica y por antecedentes).
  13. #1 se me han caído las lágrimas con tanta precisión matemática en un artículo.

    Esta misma noche voy a repasarlo con lápiz y papel en mano.

    Una delicia.
  14. La curva exponencial de infectados por el coronavirus se mantiene y todo el que sepa lo que una curva exponencial supone debería de estar ahora mismo como poco preocupado.

    Fuente: gisanddata.maps.arcgis.com/apps/opsdashboard/index.html#/bda7594740fd4  media
  15. #2 Una cita que no tiene nada que ver con el tema del artículo. Es un artículo técnico, no va de nadie queriendo mentir a nadie.
  16. #18 Sabiendo lo que es una curva exponencial y sabiendo tambien el tamaño y condiciones de la muestra, no, no estoy preocupado.

    Hablamos de casos confirmados. Esto quiere decir que hasta que no se complete un ciclo de incubacion completo, no se puede concluir nada. De momento lo que es exponencial son los esfuerzos de deteccion, no los casos. Si dentro de 8 dias permanece la naturaleza exponencial, entonces si que podemos empezar a estudiar si se puede atribuir al virus.

    Ojo, que no estoy diciendo que las infecciones no sean exponenciales. Solo estoy diciendo que no hay suficientes datos para concluir nada.

    Se podria concluir algo mas si supieramos cuantos tests salen negativos. Eso ayudaria.
  17. eso solo es cierto para la gente que no sabe de estadistica, solo te engañan con estadisticas si te dejas

    #19 el tema es que la cita de le sirve muy bien a la gente que no sabe estadistica para no sentirse mal por ello y sobretodo a la gente que quiere mentir para que los demàs no quieran aprender estadistica
  18. #1 Innacurate y misleading no significan "incorrectas". Tu traducción es incorrect y misleading (lleva a confusión).
  19. #18 Estoy con #20, siguiendo la lógica del artículo, y dado que la atención mediática sobre el problema sabemos que ha crecido exponencialmente, no sabemos como es la curva real, es muy posible que, aunque el crecimiento fuera lineal, la curva de casos confirmados fuera exponencial. Lo cual no demuestra, por supuesto, que no sea exponencial, pero la estadística hay que entenderla en su contexto.
  20. #20 #23 En un par de semanas tendremos detalles más concluyentes. Pero la cosa no parece halagüeña.
  21. #24 Depende principalmente de si los controles de los estados en general y China en particular resultan efectivos para evitar la expansión, en mi opinion, pero si en algo destaca china es en el control de la población y en la capacidad de poder desplegar cantidades brutales de recursos rápidamente
  22. #0 estoy con , la estadística es correcta, está bien hecha, pero si no sabes estadística te puede llevar a error, así que no es "incorrecta", sino "engañosa" (Y ni si quiera, para mí "engañoso" tiene una connotación de premeditación que no tiene "misleading", pero no encuentro un sinónimo mejor)
  23. #6 Está claro, la clave es generar un modelo que tenga eso en cuenta. No sé si será difícil o no, pero un punto de partida deberían ser la gripe común u otros virus similares pasados.
  24. #18 La parte de crecimiento rápido es la inicial. Es mucho más probable que nos encontremos en una curva chi-cuadrado, de la que desconocemos el parámetro poblacional. Deberíamos situarnos en un valor seguro mucho mayor que el valor actual (una frontera inferior del valor real) pero tampoco generar alarmismo, ya que en principio no tiene el ratio de afectados de un SARS y mucho menos de un MERS, virus mucho peores.
    Respecto al artículo, no creo que nadie vea el dato de los casos confirmados y piense que se trata de un estimador estadístico (insesgado, consistente y eficiente) de ningún parámetro, sino simplemente lo que dice que es: el número de confirmados.
  25. #16 Y en Español deberíamos ser también precisos, y además tenemos palabras suficientes para serlo.
  26. #26 Así es, las estadísticas son correctas cuando se usan bien.

    Algo que siempre se olvida es que las estadísticas son esencialmente aplicadas, es decir, siempre responden a un problema de investigación. Por consiguiente sin pregunta no hay respuesta. Lo que pasa casi siempre que se montan pollos porque se ha respondido una pregunta y el titular o la interpretación se hace desde otra pregunta.

    Por ejemplo, la pregunta ¿Es más seguro viajar en coche o en avión? Es ambigua. Hay que concretar antes de hacer números

    Pregunta (a) A lo largo de mi vida si muero en un accidente ¿Tengo más probabilidad de morir en coche o en avión?
    Teniendo en cuenta que viajamos en coche a diario varias veces y el avión ocasionalmente. Morir en accidente de tráfico es mucho más probable. El avión es más seguro. (Ojo con la conclusión)

    Pregunta (b) Mañana voy a Madrid ¿que es más seguro ir en coche o en avion? El coche es más seguro para un viaje puntual. El coche es un medio de transporte más seguro. (Ojo con la conclusión)

    Conclusiones aparentemente contradictorias y ambas ciertas.

    ¿Es más seguro el coche o el avion? Pues depende... Concreta tu pregunta o se forma pitostio. Las compañías aéreas dirán una cosa.....

    Ese es el problema de la estadística se dan respuestas concretas y se publicita como respuestas a otra pregunta más general.
  27. #30 Pero el problema no es solo de quien hace la estadística o del que la publica, el problema también está en quien la lee... Si lees un artículo titulado "viajar en coche es más seguro que viajar en avión", lo normal es que como lector entres a ver qué preguntan exactamente, si se refieren a que es mas dificil morir en un accidente de coche pero tu te quedas con otra idea, la culpa es tanto del redactor de la noticia como tuya.
  28. #21 #19 La cita hay que entenderla , creo yo, como una crítica a las cifras estadísticas proporcionadas muy frecuentemente por diversos entes públicos o privados que tienen más bien un fin manipulador. Pero nada tiene que ver con la estadistica formal que dudo yo que nadie en su sano juicio vaya a criticar.
  29. #31 así es, los artículos de prensa son expertos inventar y sacar conclusiones y muchos lectores en creerselas. Pero la base de los engaños y la mala fama de la estadística es casi siempre confundir (accidentalmente o para manipular) lo que se está preguntando con lo que se hizo el calculo.

    Osea inventarte una pregunta y dar la respuesta a otra pregunta cómo válida para la primera
  30. #32 Las citas son como la estadística: Tienen un objetivo, si las lees con cuidado y con su contexto te dan información, pero pueden ser usadas para manipular a quien no tiene tiempo/ganas/capacidad para entenderlas, dándole además una capa de respetabilidad a la mentira. Me da igual la intención original de quien dijo la frase, hoy dia se utiliza para engañar a la gente que no se fia de las estadísticas (por no tener tiempo/ganas/capacidad para entenderlas) para que se fién aún menos y sean más fáciles aún de timar.
  31. #34 Sin duda me parece un comentario muy interesante pero fijate, ¿Crees que verdaderamente la gente tiene en general los conocimientos necesarios para fiarse o no de la estadistica? Porque la estadistica es también a mi entender el cálculo de probabilidades , la inferencia estadistica e incluso si nos sumergimos más en realidad es teoría de la medida, álgebra de boole... y dudo que la gente en general rechace o deje de rechazar eso porque directamente desconocen esos conceptos. En cambio, en mi opinión por supuesto , lo que creo que ocurre es que puede haber un rechazo a ciertas conclusiones finales y el modo de expresarlo (gráficas y A veces titulares confusos) y es ahí donde ciertamente en muchas ocasiones no se están expresando conclusiones estadísticas formales si no pseudo estadistica con un fin manipulador.
  32. #35 A menudo solo es necesario sentido común y pensar 5 minutos para ver si una estadística está intentando timarte. No necesitas recalcular las matemáticas, sino los planteamientos y conclusiones. Pongamos como ejemplo esta basura "periodistica": www.alertadigital.com/2018/12/13/suecia-capital-de-violaciones-en-occi

    No necesitas saber estadística para saber que es mentira ¿verdad¿
  33. #6 Por un momento pensé que ibas a decir "It is very difficult todo esto..." A lo Rajoy mode. :-D
  34. #27 El modelo ya existe.
  35. #13 esto sigue una distribución estadística que tiene una serie de parámetros. Las observaciones sirven para estimar los parámetros. Una vez que se tienen estimados (con un cierto margen de error), se pueden hacer previsiones sobre cosas como la cantidad de casos reales, la cantidad de casos detectados, las muertes que se van a producir, los enfermos que se van a sanar... todo ello en función del tiempo.
    Cuando dicen que hay 2.700 casos detectados simplemente nos están dando solo un dato de los muchos que tienen.
  36. #26 #22 #16 tenéis razón. Estuve un rato decidiendo qué hacer con ese misleading, porque engañoso no me parecía buena traducción. Luego vi innacurate en el segundo titular y de "no preciso" a "incorrecto" me pareció que había poca distancia. Pero tenía que haber puesto impreciso. Error mío.
    Un saludo.
comentarios cerrados

menéame