Contenido creado por Seguridad_Administrador
¡Cometamos nuevos errores!

Escribe Daniel Mordecki

Más que errores en las encuestas en Argentina

La probabilidad de los pronósticos previos a las presidenciales argentinas es de 0.00000000000000000000000000345%.

No puede tratarse apenas de un error.

02.11.2015 20:07

Lectura: 4'

2015-11-02T20:07:00-03:00
Compartir en

---

Después de tantos años de analizar resultados de encuestas uruguayas, esta incursión en las encuestas de intención de voto argentinas me resultó a la vez interesante y sorprendente.

Se trata de una realidad no solo más compleja y de mayor tamaño, sino fundamentalmente más caótica.

Muy pocas veces se respeta(1) la ley electoral(2) que obliga a las encuestadoras a publicar la ficha técnica de cada encuesta en el sitio de la Cámara Nacional Electoral antes de realizarla.

Algunas encuestadoras son asociadas abiertamente con uno u otro sector político, y los medios de prensa se muestran sorprendidos de que tal encuestadora “con buenos vínculos” con un candidato afirme que gana el otro.(3)

En la marea de datos, gráficos y análisis es realmente difícil entender el origen de la información que se muestra: prácticamente nunca aparece una ficha técnica y cuando aparece, rara vez está completa.

Sesgado a primera vista

Para darse cuenta de que las encuestas para la elección presidencial del 25 de octubre en Argentina tienen un fuerte sesgo, no es necesario hacer ninguna cuenta.

Alcanza con prestar atención a los pronósticos para Del Caño y Stolbizer. Todas las encuestadoras pronosticaban el triunfo de Stolbizer sobre Del Caño y sucedió exactamente al revés.

Dado que ambos candidatos ocupan el cuarto y quinto lugar en las preferencias electorales, la importancia política de semejante error es muy baja, y por tanto, los análisis post-electorales ni siquiera mencionan este hecho. Pero desde el punto de vista estadístico las cosas son muy distintas.

Tamaño error deja en evidencia que las encuestadoras pulen sin piedad los valores del trabajo de campo: como en su micromundo les resulta evidente que Stolbizer le ganará a Del Caño, suman y restan el par de puntos necesarios para quedar alineados con la supuesta realidad construida por el resto de las encuestadoras.

Cuatro años, once meses y dos días de lluvia

No se me ocurren hechos tangibles con una probabilidad tan baja como 3.45E-29 o si se prefiere 0.00000000000000000000000000345%. Tal vez los cuatro años, once meses y dos días de lluvia sin pausa del Macondo de García Márquez tengan una probabilidad así, porque al final de cuentas, podría pasar, ¿no?

Pues esa es la probabilidad de que las encuestadoras le erren tan feo como lo hicieron en las presidenciales argentinas de octubre. No se trata de un mero error, o de márgenes de tolerancia, o de problemas del modelo: se trata del pulido sistemático de los datos, descreyendo de lo que le muestra el trabajo de campo y torciéndolo hasta que coincida con lo que mandata la realidad virtual construida por todas las otras encuestas propias y ajenas.

Sea por los motivos que sea, se mueven todos en conjunto como un rebaño en un contexto totalmente ilusorio, que se hace trizas solamente cuando los datos reales salen a la vista el día de la elección.

Y al día siguiente comienzan nuevamente.

Encuestas de verdad

Las encuestas de verdad existen, pero son muy distintas a las que estamos acostumbrados, con precisión clínica y pronósticos apretados en un rango de dos o tres puntos.

En la hipótesis de que las elecciones argentinas hubieran tenido como resultado exactamente el promedio de las 6 encuestadoras analizadas, (40% Scioli, 28% Macri) la probabilidad de obtener los pronósticos que publicaron es del 22%. No está nada mal, y muestra claramente que si no las manipularan arbitrariamente, las encuestas son una herramienta válida.

Pero de todos modos un 22% es poco: es más probable que estén erradas a que acierten. Las encuestas de verdad se dispersan más alrededor del valor real y tienen márgenes de error mayores, cercanos a +/-5%. De esta forma el sistema de encuestas se vuelve más probable, haciendo gala de su capacidad de predecir el futuro sin esconder su limitación para hacerlo con precisión.

Los cálculos

Los cálculos siguen la siguiente lógica:

  • Se define el universo y los valores oficiales, en este caso:
    • Total de votos positivos: 24,420,841 - 100%
    • Votos a Scioli: 9,002,242 - 36.86%
    • Votos a Macri: 8,382,610 - 34.33%
  • Para cada encuestadora se calcula la probabilidad de su pronóstico en función del tamaño de la muestra y del error publicado.
  • Se ajustan las encuestadoras cuyos pronósticos no están calculados sobre los votos positivos, de modo de equipararlos al resto.

  • Se calcula la probabilidad del sistema multiplicando la probabilidad que obtuvo cada una de las seis encuestadoras.

 

Descargar el programa PHP y los datos en Excel

Explicación detallada de la metodología

---

1 - http://www.infobae.com/2015/07/30/1745172-tras-el-fracaso-los-pronosticos-la-justicia-exigio-las-encuestadoras-respetar-la-ley
2 - Ac.117/10 C.N.E - http://www.pjn.gov.ar/cne/sistemaencuestas/pdf/Acordada%20117.pdf y Ac.89/15 C.N.E. - http://www.pjn.gov.ar/cne/sistemaencuestas/pdf/AE089-15.pdf
3 - http://www.eldestapeweb.com/encuestas-2015-una-consultora-buenos-vinculos-el-pro-asegura-que-gana-scioli-n10935

 

.