Desde hace semanas, una de las preguntas clave que se hacen expertos de Sanidad, periodistas y ciudadanos es cuándo la pandemia de coronavirus alcanzará su punto más alto, a partir del cual empezará a descender. Es el famoso “pico” de la curva. Si hace apenas unos días el Gobierno decía que no se podía saber, este miércoles ha pasado a apuntar que quizá ya hayamos llegado, pero no lo sepamos por la demora de 5 o 6 días entre la realidad y los datos oficiales
|
etiquetas: estadistica , coronavirus , retraso , predicción , gobierno
Y si es así como es que una cosa tiene retraso y otra no ?
Eso es incorrecto. Solo están serios o graves un 7%.
www.worldometers.info/coronavirus/country/spain/
46,406 Currently Infected Patients
43,240 (93%) in Mild Condition
3,166 (7%) Serious or Critical
Al fin y al cabo los que van al hospital son un porcentaje de los infectados. Si crecen los infectados, crecen los que ingresan en el hospital y viceversa.
La estadística no requiere que los datos estén uniformemente distribuidos por la zona a evaluar para obtener datos estadísticamente significativos.
Estamos hablando de ciencia.
Ese tamaño muestral (y de 2.000 a 3.000 es una diferencia enorme) para este caso tiene que ser mayor que para un estudio de opinión.
Esto no va de que a una persona se le presenta una cuestión y esta responde lo que opina (o no responde). Esto va de si a alguien le ha llegado la infección o no, y eso es mucho más complicado de ver.
No puedes inferir lo mismo a partir de los mismos muestreos, pues depende de con quién haya estado esa persona, cuándo, etc.
¿Que te dice algo? Sí, pero mucho menos fiable que si hablásemos de unas elecciones, y ya en estad fallan que lo flipas.
Quizá no me he explicado, lo que yo propongo es que en una muestra estadísticamente significativa se les aplique la prueba del coronavirus, la prueba médica que o bien da positivo o bien da negativo.
A su vez dada la situación de estado de alarma se podría legislar para que hacer la prueba fuera obligatorio, con lo que te evitarías los agujeros de datos en cuanto a que el elegido no quiera responder (no tiene que responder nada en este caso) o mienta (es el test el que "habla", no la persona). Se te presenta en casa un médico con escolta policial, abres o te abren la puerta y te hacen la prueba. Siguiente.
Una muestra de 2.000 o 3.000 personas estadísticamente elegida permite obtener resultados estadísticamente significativos.
Multiplicar por diez la muestra no te ofrece unos resultados diez veces mejores, en todo caso te puede reducir el margen de error en alguna décima.
El coronavirus nos ha mostrado la cara oscura de la exponencialidad, parece que no pase nada, que siga sin pasar nada, todo sigue tranquilo, y luego ay ay ay, esto se nos va de madre, como es que no lo hemos visto antes, joder joder joder.
En el caso de la estadística también aplica la exponencialidad pero en el sentido inverso, una muestra de unos pocos individuos te ofrece una mierda de resultados, doblar la cifra de la muestra te ofrece una mierda prácticamente idéntica, doblas un par de veces más y ya tienes resultados que sí son representativos de lo que buscas, seguir doblando no te aporta prácticamente nada, simplemente estás malgastando recursos y un valioso tiempo.
En esta web puedes calcular el margen de error según el grupo poblacional y número de muestras: www.surveymonkey.com/mp/margin-of-error-calculator/
Pero sigo pensando en que una prueba con un tamaño muestral tan pequeño para esto no sirve. El enlace que has puesto es sobre algo que ya estudié en su día (aunque hace ya más de 20 años y no me acuerdo cómo se calculaba, pero la idea sí) y, como bien dice después, se trata de la fiabilidad a la hora de tener una representación "de las visiones (léase opiniones) de la población". Sí, en esa webapp te dice que para unos 46,5 millones, con una muestra de 3.000 tienes un error del 2%. Pero insisto, se habla aquí de opiniones.
En la manzana en la que vivo (lo cual no significa que sea un gusano, badumchásss...) hay como unos 20 edificios. Seguramente a nivel estadístico es adecuado pensar que los votantes del psoe van a ser proporcionalmente los mismos en el edificio 1 y en el edificio 20, lo mismo para el pp, lo mismo para c's, lo mismo para podemos, lo mismo para... lo que sea que se presente. El estudio para ver a quién se encuesta se basa en factores socioeconómicos, además de geográficos, y más o menos da igual que pregunten a alguien del edificio 1 o del 10 o del 20. Son todo personas con, máaas o meeenos, desde el punto de vista estadístico, una distribución parecida, similar, de opiniones.
Pero si ahora yo en el edificio 1, por lo que sea, me infecto y no lo sé porque estoy asintomático, a los que puedo contagiar son a los de mi edificio 1, pues habré puesto la mano en el pasamanos, en el pomo del portal, lo que sea. Lo que está claro es que es muy improbable que contagie a los de los otros 19 edificios dado que el contacto con ellos es virtualmente nulo. El contacto es el mismo que pueda tener con cualquier otro que me cruce en la calle, pero no habrá contacto físico tan "directo" (o menos indirecto si queires) como es compartir elementos que tocamos.
Así pues, si coincide que el estudio determina que se haga la prueba a alguien de mi edificio, será más probable que detecte un positivo que si lo hace en los otros 19.
¿Me explico? fíjate en lo que han hecho en Corea y en Japón, no se han ido a esos tamaños muestrales, se han ido a mucho más.
Y eso suponiendo una situación estática, lo cual es incorrecto, pues esto es algo que varía, y mucho, de un día para el siguiente, con lo que las muestras se tienen que estar haciendo "continuamente". Incluso sin comillas si me apuras, no necesariamente a los mismos si no hay motivo (no ha habido positivos nuevos en su zona) pero sí que a muchos más. Virtualmente habría que hacérselos a todo el mundo, priorizando en aquellos lugares donde ya sepamos que hay un porcentaje mayor de de gente infectada, con la intención de no colapsar los servicios de salud.
Depende. La.forma.de hacer correctamente la estadística depende de si la.situación geográfica influye. Y sabemos que influye... pero no sabemos exactamente en qué grado
De los que hay en UVi morirán muchos. E incluso algun día concreto pueden ser una barbaridad. Pero YA estaban en la UVi
No es un tamaño muestral pequeño para un grupo poblacional de 50 millones. Es un tamaño muestral que ofrece resultados estadísticamente significativos.
Otra historia es que creas que la estadística no da resultados válidos, pero eso es un problema tuyo con la ciencia.
Sí, en esa webapp te dice que para unos 46,5 millones, con una muestra de 3.000 tienes un error del 2%. Pero insisto, se habla aquí de opiniones.
Es irrelevante de qué se hable, el margen de error es el mismo. De hecho como he indicado al hacerse obligatorio y que la respuesta la dé una prueba científica el margen de error se debería reducir al reducir los factores de error.
Así pues, si coincide que el estudio determina que se haga la prueba a alguien de mi edificio, será más probable que detecte un positivo que si lo hace en los otros 19. ¿Me explico?
Se te entiende, no confías en los resultados estadísticos. Ejemplos como el que has puesto te los puedes inventar con cualquier cosa, te inventas un ejemplo en el cual crees que la estadística no daría buen resultado y luego concluyes que la estadística no da resultados válidos. Por eso tu reacción natural es aumentar la muestra por que como más te acerques a una muestra de 50 millones más confianza te darán los resultados.
Eso es no confiar en la ciencia de la estadística.
Y eso suponiendo una situación estática, lo cual es incorrecto, pues esto es algo que varía, y mucho, de un día para el siguiente, con lo que las muestras se tienen que estar haciendo "continuamente".
Otro argumento que puedes usar para cualquier tipo de dato y valor, en un grupo poblacional de 50 millones de personas siempre hay factores que puedan alterar la muestra durante la ejecución del estudio estadístico.
Virtualmente habría que hacérselos a todo el mundo
Gracias. Te iba contestando conforme te iba leyendo y no estaba seguro de si serías tan explícito como has sido, efectivamente niegas la validez de resultados estadísticos, ese es el único motivo por el que pides muestras más grandes. No para mejorar el resultado estadístico si no para eliminar la estadística del resultado.
Tienes un porcentaje de gente sin síntomas que puede hacer que el número de afectados se doble (con un 50%) o se multiplique por cinco (80% de asíntomáticos)
Esa gente ni se ha enterado que tiene el virus. Es más, lo podemos tener tú y yo y no enterarnos. Y no vamos al hospital, ni al médico, ni nada.
No se trata aquí de "confiar en la ciencia de la estadística". Se trata de hacer un buen muestreo. Y a mi modo de ver no sirve para esto el mismo tipo de muestreo que sí se usa para obtener opiniones políticas o de cualquier otro tipo. No estamos buscando cuántos votan a X o cuántos tornillos salen defectuosos de fábrica. Esto es otra cosa.
Me encanta (es sarcasmo) que manipules y digas que pienso o digo cosas que ni pienso ni digo. Hasta aquí.
Se te entiende, esto es algo serio y para las cosas serias la estadística no te vale, necesitas hacer un muestreo de todos y cada uno de los individuos para que no haya estadística de por medio.
Y los que mueren son los que ya han ido hace tiempo (bueno, no todos, pero prácticamente)
Vamos, que le bicho o sus efectos no se van nunca del todo.
Imagino que se podrá hacer de más afecciones. No sabía esto. Supongo que serán los anticuerpos que obliga a generar.