Contenido creado por Gonzalo Charquero
¡Cometamos nuevos errores!

Escribe Daniel Mordecki

Opinión | El plebiscito del fainá de orillo

La idea apriorística de la estratificación como una receta siempre beneficiosa no es cierta.

23.12.2024 13:40

Lectura: 12'

2024-12-23T13:40:00-03:00
Compartir en

Este relato está dedicado al ingeniero Bruno Vuan, a quien aprecio por su trabajo y respeto por sus conocimientos, que me dijo algo así como: “El cálculo de probabilidad que hiciste está mal. Asumiste muestras aleatorias simples, sin tener en cuenta que no lo son: la muestras están estratificadas por demografía”.

En dos días es el plebiscito del fainá de orillo. Al final, este domingo 6 de enero vamos a decidir si incluimos en la constitución el derecho a comer el fainá del grosor que se nos cante. ¡Qué regalo de reyes!

Ya es un hecho conocido, pero, por si hay algún despistado que no lo sabe, en marzo del año pasado se aprobó una ley que obliga a que las asaderas para fainá tengan un agujero en el medio, de modo que todo el fainá en Uruguay sea de orillo.

El tema surgió casi inadvertidamente cuando en una nota veraniega, de esas intrascendentes, un turista argentino que estaba pasando sus vacaciones en Punta del Este dijo: “Ustedes acá tienen algo repiola: todo lo que es el fainá de orillo. Pero en algunos bares los chabones te dan fainá grueso. Deberían prohibirlo. Para comer fainá grueso voy a Güerrín”, por la popular pizzería de la avenida Corrientes.

La idea de que si no se prohibía el fainá grueso el turismo se iba a resentir duramente se expandió en el este a la velocidad a la que se tranca el tránsito en Gorlero. Y a la misma velocidad recogió la férrea oposición de la zona del litoral del río Uruguay, donde parecería que la influencia argentina hace que sea muy popular el fainá grueso. Las malas lenguas dicen que es simple envidia del éxito turístico de la costa atlántica, pero sea por uno o sea por otro, la discusión se instaló, y de forma virulenta.

La cuestión es que un diputado muy defensor de los valores y el trabajo para unos y muy oportunista para los otros propuso prohibir las clásicas asaderas para fainá y reemplazarlas por otras en forma de O, con un agujero en el medio, que solo producen fainá de orillo. La iniciativa cuajó, y hoy es ley.

Rápidamente se organizó el Grupo Republicano Unificado por el Espesor Opcional (GRUESO), y se juntaron las firmas para que se plebiscite la inclusión en la constitución del derecho comer el fainá del grosor que se nos antoje.

Las firmas se presentaron, la Corte Electoral las validó y fijó la fecha del plebiscito para el próximo domingo 6 de enero, en dos días. Como estamos aburridos en la veda, vamos a analizar un poco las encuestas del ya famoso plebiscito del fainá de orillo.

Las top top

Las encuestadoras top top de Uruguay —Letra, Yo Solo y Relatum— se zambulleron de cabeza ante la oportunidad de aparecer (un poco más todavía) en los informativos. Pero con estrategias distintas.

La consultora Letra decidió hacer una encuesta aleatoria en todo el territorio nacional, la consultora Yo Solo decidió hacer una muestra con dos estratos —el norte del río Negro y el sur del río Negro— y la consultora Relatum decidió partir el país en cinco estratos.

Consultora Letra, sin estratos. Foto: Imagen de Daniel Mordecki

Consultora Letra, sin estratos. Foto: Imagen de Daniel Mordecki

Consultora Yo Solo, dos estratos. Foto: Imagen de Daniel Mordecki

Consultora Yo Solo, dos estratos. Foto: Imagen de Daniel Mordecki

Consultora Relatum, cinco estratos. Foto: Imagen de Daniel Mordecki

Consultora Relatum, cinco estratos. Foto: Imagen de Daniel Mordecki

Acá es imprescindible hacer una digresión relevante para entender lo que sigue, que comienza con una confesión: hicimos un pacto secreto, espurio y maloliente con la Cleptocorporatocracia (1). La cuestión es que mientras distraen a la gilada para que pelee contra las vacunas y las antenas 5G, generaron un mecanismo para tener en tiempo real lo que opina cada uno de los uruguayos, y la clave es la cédula. ¿Vieron que ahora tiene chip? Bueno, ese chip, y esto está comprobado científicamente, se autorreproduce generando nanochips que entran por las yemas de los dedos y navegan por el torrente sanguíneo hasta instalarse en el lóbulo frontal del cerebro. Desde allí comienzan a monitorear todos tus pensamientos y los transmiten por bluetooth a los paneles multimedia de los autos chinos. ¿Vieron qué baratos son los autos chinos? Ahí tienen la explicación.

A través de nuestro pacto podemos tener en tiempo real lo que opinan los ciudadanos sobre cada cosa, y en particular sobre lo que nos interesa a nosotros, que es si van a votar a favor o en contra de poner en la constitución el grosor del fainá.

RegiónHabilitados en la Corte ElectoralPor el fainá de orilloPor el fainá gruesoBlanco o anulado
Sureste402.17779%16%5%
Metropolitana1.457.59051%44%5%
Suroeste387.22118%76%6%
Noreste168.93244%49%7%
Noroeste311.20012%83%5%
Total2.727.12045,56%49,17%5,27%

Con esa información, hicimos una simulación de 100.000 encuestas para cada una de las encuestadoras, y aquí está la gráfica (2):

Foto: Imagen de Daniel Mordecki

Foto: Imagen de Daniel Mordecki

Como podrán apreciar, las gráficas de la encuesta de la consultora Yo Solo son un poquito más altas que las de la consultora Letra; las de Relatum, que tienen cinco estratos, son aún más altas. Esto es porque las encuestas estratificadas, si los estratos son más homogéneos como en este caso, tienen menos dispersión. Que la gráfica sea más alta quiere decir que hay más resultados en la zona central y menos en la zona lateral, y eso es bueno: la encuesta es más precisa.

Eso se refleja en la varianza de la simulación para cada consultora. Mientras que la de Letra es de 2,47, la de Yo Solo, con dos estratos, es de 2,38 y la de Relatum, con cinco estratos, es de 2,07. Casi medio punto menos de varianza, una ganancia significativa, que nos tienta a pensar: cuanto más estratificado, mejor. ¡Bien por Relatum!

Pero hay un pequeño problema. Las gráficas de Relatum no están centradas en el valor real; la del fainá de orillo un poco a la izquierda (45,27%) y la del fainá grueso un poco a la derecha (49,45%). También Yo Solo tiene una desviación, pero con solo dos estratos la diferencia es ínfima. Con cinco estratos, los problemas de redondeo comienzan a notarse.

Aunque las simulaciones son perfectas, cuando hay que partir los mil encuestados no se pueden colocar 147,47315 personas en un estrato, por lo que se colocan 147, y así en cada estrato se acumulan pequeñas diferencias que terminan afectando el resultado final. En resumen, tenemos un poquito más de certeza de un resultado un poquito más erróneo.

El jueves antes de la veda

El jueves antes de la veda es día de fiesta para las encuestadoras: todo un país tiene la mira puesta en los informativos centrales. Pico de rating. Como ya dijimos, nosotros tenemos un pacto secreto, espurio y maloliente con la Cleptocorporatocracia (3) que nos permite saber en tiempo real qué sucede en la cabeza de los votantes, y eso en este caso se resume muy fácilmente: nadie cambió de opinión. Ni un épsilon que tiende a cero.

También sabemos, y para esto alcanza con mirar el almanaque, que la semana pasada fue 1º de enero, empezó la temporada de verano y muchos uruguayos se fueron a los balnearios del este: algunos a trabajar, otros a veranear. El saldo neto es que 60.000 (4) personas se fueron de los distintos departamentos hacia Maldonado y Rocha.

RegiónHabilitados en la Corte ElectoralMigración hacia el sureste
Sureste402.177-
Metropolitana1.457.59032.000
Suroeste387.22111.000
Noreste168.9323.000
Noroeste311.20014.000
Total2.727.12060.000

Naturalmente, ni Letra, ni Yo Solo, ni Relatum tienen esta información. La desconocen por completo porque, a diferencia de nosotros, ellos hacen encuestas independientes y no tienen un pacto secreto, espurio y maloliente con la Cleptocorporatocracia (5). Por lo tanto, los estratos de las encuestas de este jueves reflejan la foto demográfica del mismo Uruguay que hace una semana. Este es el resultado:

Foto: Imagen de Daniel Mordecki

Foto: Imagen de Daniel Mordecki

La gráfica de Letra, que toma una muestra aleatoria de todo el país, es exactamente igual, pero las otras se desplazaron. La de Yo Solo levemente (45,40% para fainá de orillo, 49,33% para fainá grueso), porque los cambios del litoral suroeste y la zona metropolitana al litoral sureste no la afectan; solo los del norte al sur. Pero la muestra más estratificada, la de Relatum, sufre mucho porque la zona más poblada del sur es desde donde se traslada más gente hacia el sureste, generando una distorsión pequeña en términos relativos (solo un 2,2% de la población cambia de estrato), pero significativa en términos del resultado final.

El resultado medio para Relatum es 44,45% para fainá de orillo y 50,26% para fainá grueso. Los valores están corridos más de un punto del valor real, porque las muestras perdieron apenas un 2% en la precisión de los estratos.

Qué aprendimos

Ya sabíamos, porque los libros lo dicen hace décadas, que cuando se conoce a priori que hay grupos homogéneos y se estratifica de forma proporcional esos grupos, la muestra gana en precisión, porque la varianza se reduce.

Inclusive, cuando se conoce a priori y con precisión el tamaño y la homogeneidad de los grupos, se pueden hacer estratificaciones no proporcionales que mejoran aún más la precisión. En el extremo de que yo supiera que en Artigas todos votan sin excepción al mismo candidato, alcanzaría con un encuestado elegido al azar en Artigas, y podría dedicar los otros 999 al resto de los departamentos.

Lo que aprendimos es que a los encuestadores les gusta mucho usar los resultados de los teoremas, pero bastante poco ser meticulosos con las hipótesis. Para estratificar, ¿sabemos realmente a priori el peso real de cada estrato? ¿Cuánto error introduce la estimación a partir del último censo o de la Encuesta Continua de Hogares (ECH)? La realidad es que los encuestadores no tienen ni la más remota idea del nivel de precisión que se necesita para que su estratificación sea beneficiosa.

Acabamos de ver cómo un 2% de error en cinco estratos genera más de un 1% de diferencia en el resultado. La encuesta del ingeniero Vuan (6) está estratificada por edad y área geográfica y posestratificada por edad, sexo, departamento, localidad/barrio o zona rural y voto en 2019 o 2024. ¿Cuánto error muestral introduce cada una de esas estratificaciones? Ni el ingeniero Vuan ni nadie tiene la más remota idea. Pero lo que aprendimos es que un pequeño error es significativo, por lo que es fácil imaginar el impacto de la concatenación de un pequeño error para cada uno de ellos.

La empresa Cifra (7), por tomar otro ejemplo, estratifica según regiones del país y zonas específicas de Montevideo, a lo que suma cuotas de sexo y edad en base a la ECH de 2022. ¿Es la ECH una herramienta válida para estratificar zonas específicas de Montevideo? Lo más probable es que no, porque tiene otra finalidad muy distinta y nadie puede garantizar que la estimación de la población de La Teja o Pocitos no tenga un 5% de error, algo que en el objetivo de la ECH es intrascendente, pero en la estratificación es catastrófico. Y a eso se suma la pregunta de qué pasó entre 2022 y noviembre de 2024 (8). Ni la encuestadora Cifra ni nadie tiene hoy la menor idea para formular una respuesta a estas preguntas que sea útil para la estratificación.

Una simulación estratificada por departamento

Para cerrar esta nota, bajamos del sitio de la Corte Electoral la votación por departamento para el balotaje 2024 e hicimos una simulación de una encuesta aleatoria y una estratificada por departamentos, exactamente igual a lo que se muestra más arriba, esta vez con 1 millón de encuestas en cada caso.

El resultado es el siguiente:

Foto: Imagen de Daniel Mordecki

Foto: Imagen de Daniel Mordecki

Como se ve en la gráfica, la diferencia en el resultado de estratificar o no estratificar en una simulación perfecta para el balotaje 2024, en la que se conocen a priori todos los valores necesarios, es irrelevante. De hecho, si se calcula la varianza es levemente superior para la estratificada —2,58 contra 2,49 de la aleatoria pura—. Esto se debe a que la combinación ponderada de todos los departamentos resulta menos homogénea que el resultado general. No es una diferencia significativa, pero es una muestra más de que la idea apriorística de la estratificación como una receta siempre beneficiosa no es cierta.

A modo de cierre

Las series históricas de pronósticos de las encuestadoras muestran con solidez y contundencia que sus resultados no son independientes, sino que tienen correlación. Ver al respecto “La nota más aburrida de la elección”.

Es fácil demostrar, como se hizo más arriba, que, como los encuestadores tienen una estimación muy gruesa de los tamaños y características de los estratos, lo más razonable es asumir que los errores que introducen al estratificar son sensiblemente mayores que los supuestos beneficios en reducción de la varianza. Y que, dependiendo de la homogeneidad de las muestras, en muchos casos ni siquiera con error cero se generan beneficios a partir de la estratificación.

Como ni los encuestadores ni nadie tiene conocimiento real de cuánto error hay en la ponderación de sus estratos, los errores que generan son independientes y por tanto deberían dispersar las muestras y no contraerlas.

La idea de que los cálculos están mal porque no toman en cuenta la estratificación no resiste análisis; cae rápidamente cuando se hacen algunos cálculos sencillos.

[1] La primera cláusula del pacto nos obliga a escribir Cleptocorporatocracia con mayúscula.

[2] Toda la información generada para esta nota, así como el código fuente de los programas para simular las encuestas, están disponibles para descargar y utilizar libremente en este enlace.

[3] La primera cláusula del pacto nos obliga a escribir Cleptocorporatocracia con mayúscula.

[4] ¿Por qué no pueden ser 60.000 exactos, así con cuatro ceros? ¿No es un número como cualquier otro? ¿Por qué tienen que dudar de la veracidad de nuestra información porque nos dio exactamente 60.000 y no 59.382 o 60.184?

[5] La primera cláusula del pacto nos obliga a escribir Cleptocorporatocracia con mayúscula.

[6] https://x.com/BrunoVuan/status/1859419357102649800.

[7] https://www.cifra.com.uy/intencion-de-voto-en-el-balotaje-3/

[8] La encuestadora Factum continúa utilizando como marco muestral el censo de 2011, aunque justo es decirlo, no está últimamente utilizando muestras estratificadas, sino aleatorias puras.