Contenido creado por Martín Otheguy
Ciencia

Probablemente...

Covid-19: naufragar en las probabilidades. Por qué la estadística no es intuitiva

Bernardo Borkenztain analiza el factor contraintuitivo en algunas de las estadísticas del nuevo coronavirus.

02.06.2020 10:39

Lectura: 6'

2020-06-02T10:39:00-03:00
Compartir en

Por Q.F. Bernardo Borkenztain

borky@montevideo.com.uy

En el libro Pensar rápido pensar despacio de Daniel Kahneman, cuya lectura recomendamos fervorosamente, se toca el tema, entre otros, de por qué la gente es tan mala interpretando estadísticas.

Esto es bastante obvio, pero sin pretender abarcar el tema, veamos que el hecho de que la gente juegue a cosas como la ruleta o la lotería, en las que las chances de ganar son ínfimas, da una idea de que como que lo de las probabilidades no se nos daría mucho.

Veamos el caso más sencillo de todos, tirar una moneda; creo que nadie discutirá que, si no está cargada, las chances son 50% para que salga cara y lo mismo para número.

Pero, ¿y si son dos? El universo posible sigue siendo sencillo, y podemos ver que hay cuatro posibilidades: dos caras, dos números, o dos formas en que pueden salir una y una. Por eso las probabilidades son 50% para una y una y 25% para cada una de los dos iguales.

Vemos el primer hecho que es sencillo, pero no necesariamente intuitivo, y es que uno de los resultados tiene dos modalidades, lo que empieza a complicarse, por ejemplo, si pasamos a un dado de seis caras (1).

Supongamos que jugamos a la generala, obviamente, con cinco dados.

Existen seis eventos de generala, ya que implica que salgan los cinco dados en el mismo número.

Sin embargo, la escalera (los dados consecutivos) parecería ser igual de complicada, porque un primer paso intuitivo parecería llevarnos a que todos diferentes y consecutivos sería lo mismo que todos iguales. Pero no. Por un lado hay dos escaleras (del dos al seis o del uno al cinco) pero, más aún, como cada dado tiene seis caras, el número de eventos favorables se multiplica porque, si denominamos a los dados de la letra A a la E, podemos tener: A1B2C3D4E5, A2B3C4D5E6, A3B4C5D6E2, A4B5C6D3E2 Y A4B5C6D2E3, y así seguir permutando los eventos hasta ver que son muchos más que los de generala, por lo que es obvio el movimiento de renunciar a la generala cuando se debe y no a la escalera.

Pero hay casos aún menos intuitivos. Pensemos en el famoso programa "El castillo de la suerte" pero para simplificar con tres puertas y no cinco.

Al principio se le pide al participante que elija una puerta sabiendo que detrás de alguna hay un gran premio, y de las otras dos baratijas (o un chancho como en una época del programa).

Claramente la chance del (único) premio bueno es 33% y no hay forma de saber nada a priori, así que el participante elige una con su tercio de chances. Luego, el conductor abre una de las puertas (que sabe que no tiene premio o el suspenso del programa se termina), y el participante se enfrenta a una situación de quedarse con la puerta que eligió o con la tercera.

Acá viene lo contraintuitivo: ambas puertas no tienen igual chance de tener el premio, ya que en el primer momento se dividieron en dos grupos, la elegida y las otras dos, con uno y dos tercios de chance, respectivamente. Sin embargo, como se eliminó una del segundo conjunto, este sigue teniendo igual el 66% de las probabilidades, así que lo racional es cambiarla cuando se le ofrezca (2), lo que vuelve a ser contraintuitivo.

Ahora bien, existe un teorema, llamado Teorema de Bayes, que nos permite calcular la probabilidad de que se dé un evento luego o a consecuencia de otro, y que es el que permite entender cómo se tiene que calcular el tema de los contagiados y los tests positivos, por ejemplo.

No podemos en esta nota utilizar el planteamiento formal, que es lo que se debería hacer, pero podemos ver algún ejemplo simplificado. Utilicemos números irreales pero sencillos.

Supongamos que la sociedad uruguaya tiene un 0.1% de infectados de SARS-COV2. Por otro lado, una prueba cualquiera tiene una chance de 5% de dar un falso positivo, o sea de que dé mal en un paciente no infectado, y un 95 % de posibilidades de dar bien (3).

El problema de lo contraintuitivo se suscita cuando uno se pone a pensar cuál es la chance de que la prueba le dé positivo y esté realmente infectado, y no se puede analizar sin saber que hay dos hechos independientes operando juntos.

Lo primero es ver que el porcentaje de infectados implica que son mil por millón de habitantes, lo que sería (suponiendo tres millones para Uruguay), 3000 en todo el país (4), pero, de cada mil pruebas que se realicen, 50 van a fallar porque eso es lo que significa 5% de falsos positivos, lo que implica que lo más probable es que, en esas condiciones se den 51 positivos(el contagiado que toca por millar más los errores) y 949 negativos.

Por lo anterior, la chance de tener realmente el contagio al recibir el resultado positivo es de 1/51, o sea 2%, y no mucho más alto como parece intuitivo.

Por supuesto que hay muchos otros factores, como la toma de muestra, que sea aleatoria y de tamaño suficiente, porque de otro modo no podemos suponer que la relación de uno a mil de los infectados se mantiene. Así, si se les toma muestras a las personas con síntomas, es mucho más alta la probabilidad, porque el número de infectados en la población con síntomas es mucho más alto, pero eso es tema para otra columna.

Q.F. Bernardo Borkenztain

(1)- Existen, para juegos como los de rol, dados de más caras, veinte, por ejemplo.
(2)- Obviamente igual puede perder, son chances, pero su probabilidad de ganar aumenta con una de las elecciones, al doble.
(3)- Nuevamente, para simplificar omitiremos que puede dar un falso negativo, por ejemplo si el test está en mal estado...
(4)- Son números ficticios para que el ejemplo se entienda, recuerde.

Por Q.F. Bernardo Borkenztain

borky@montevideo.com.uy