lunes, 9 de julio de 2012

lunes sobre las encuestas

durante toda la elección y de manera muy marcada, hubo una fuerte guerra de encuestas. al final, los resultados parecieron tan inflados que las casas encuestadoras y los medios que las patrocinaron tuvieron que salir a pedir una corta y ridícula disculpa


obviamente este resultado dejó a todo mundo bastante descontento. no es para menos la influencia de las encuestas para manipular la intención de voto: miles debieron pensar que ya estaba decidido. 

ADNPolítico.com, que hizo un seguimiento de todas las encuestas -llamado Encuesta de Encuestas- realizó una evaluación de las casas encuestadoras contra los resultados del PREP y del Conteo Rápido del IFE para calificar cuál de ellas sería mejor según -principalmente- por la diferencia que habían anunciado entre el puntero y su seguidor. este ejercicio, claramente, es muy fácil hacerlo ahora y es completamente imposible cuando las encuestas son sólo encuestas.


declarando así a María de las Heras como la mejor casa encuestadora, la que estuvo más cerca o el adjetivo que usted quiera. ofrecen además una tablita que me gustó más



aunque no del todo, pues compara cosas que a mi gusto no son comparables: los porcentajes que ofrece tanto el PREP como el Conteo Rápido son preferencias brutas, es decir, que no suman cien porciento pues hace falta considerar nulos; por el otro lado, los porcentajes de todas las casas encuestadoras son efectivos, es decir, asumiendo que el total excluye la no respuesta. así pues, me puse a hacer mi propia tablita para dejarla de modo que me guste un poco más. 

A. preferencias efectivas y el margen de error. 

antes de presentarla, quisiera hacer varias aclaraciones: calcular el porcentaje de preferencias efectivas del PREP es sencillo: los cuatro candidatos suman noventa y siete punto cinco. para los del conteo rápido, no es así pues los escenarios pueden ser muchos; por facilidad, consideré el mismo noventa y siete punto cinco como el total; es decir, asumo que la cantidad de votos nulos siempre suma dos punto cinco.

luego, no sólo convertí las cifras del IFE en preferencias efectivas, además convertí los números que entregó cada casa encuestadora como un intervalo cuyo centro es el número que ofrecen y va desde menos el margen de error a más el margen de error. los datos de margen de error fueron tomados de la Encuesta de Encuestas y cuando se desconocían -en el caso de María de las Heras e Ipsos-Bimso- se tomó como tres. todas las demás tienen un margen de error distinto que aclararé al final.


así, quisiera inventarme un sistema de estrellitas. la calificación máxima es de cuatro estrellas y la mínima es de cero. cada casilla marcada con rojo indica que el valor que arrojó el PREP no está dentro del intervalo que entregó la casa encuestadora y pierde una estrella. 

todos tienen la estrella de Gabriel Quadri, pues con intervalos de hasta siete puntos, estaba complicado errarle. además, observarán que los intervalos de Gabriel no parecen de la misma longitud que de los demás; esto es por respeto, pues no quería ponerle números negativos. 

con cuatro estrellas, diría que Grupo Reforma y Covarrubias hicieron muy buenas encuestas y confío en ellas. con tres estrellas, diría que María de las Heras hizo una buena encuesta y confío en ella -además, la cuarta estrella la perdió por menos de una décima. 

por el otro lado, con sólo una estrella, la de Milenio-GEA ISA me parece una pésima encuesta y Mitofsky, Parametría, Ulises Beltrán, Buendía y Laredo y Con Estadística me parecen malas. no confío en ninguna.

B. los intervalos mañosos. 

ya arrancando la recta final de la contienda, critiqué fuertemente cómo se presentaron los resultados de la encuesta que entregó el Observatorio Electoral Universitario, con datos que le había encargado levantar a Berumen -quien nunca entregó su propio análisis, creo. 

digo sobre la manera en que se presentaron los resultados porque concluyeron que había empate técnico tomando en cuenta el punto más alto del intervalo de Andrés Manuel con el punto más bajo del intervalo de Enrique, sin considerar el caso extremo opuesto. así pues, quisiera observar qué sucedería su evaluamos a las encuestas malas con esta misma lógica. 

claramente no estoy defendiendo el trabajo mal hecho y posiblemente con malas intenciones de gente que cobra millones por hacer esto. al contrario, este análisis podría ayudar a mostrar cómo las encuestas ofrecen todas resultados muy parecidos, pero los presentan de manera muy distinta según su conveniencia. este análisis se reducirá a las últimas seis encuestas en la lista -porque la verdad nunca seguí Ipsos-Bimsa- y sólo alteraré los datos que están en las columnas de Enrique y Andrés Manuel. 

la lógica que seguiré para modificar los datos es la siguiente: las encuestas presentaron el máximo valor para Enrique -es decir, el valor medio más el margen de error- y el mínimo valor para Andrés Manuel -es decir, el valor medio menos el margen de error. si el análisis anterior -el que pedía considerar los intervalos- podía acortar la ventaja de punteros hasta en seis puntos -el doble del margen de error-, este podría acortarla hasta en doce. 

la tabla quedaría así:


ahora la cosa se ve increíblemente distinta: casi todas tienen sus cuatro estrellas y las que no, se han equivocado por algo así como un punto. es decir, con todo y este análisis que supone malas intenciones, las encuestas de El Universal y la de Milenio son simplemente malas.

es decir, las encuestas probablemente llevaron a cabo un ejercicio con perfecto rigor estadístico, fue la presentación de los datos la que estuvo claramente sesgada para mostrar lo que querían mostrar, para favorecer a uno, dañar a otro y modificar las preferencias. es decir, los números no están inventados ni la muestra elegida de manera tendenciosa ni nada, es cómo se presentan los resultados donde está la mala intención.

C. atenuantes.

hasta aquí he hecho uso sólo del margen de error -y de las malas intenciones- para tratar de encontrar en las encuestas los valores que encontramos en la elección. es claro por qué esta no es una explicación que pueden ofrecer las distintas casas encuestadoras. 

quisiera ofrecer otros atenuantes y algunas dudas sinceras. en la siguiente tabla se puede encontrar el margen de error que entregó cada casa encuestadora -según datos de ADNPolítico.com- con las aclaraciones que se hicieron antes. muestra, además, dos datos que me parecen sumamente relevantes: el porcentaje de no respuesta y el tamaño de la muestra.


el tamaño de la muestra es más o menos el mismo para estas encuestas, pero no así para el Conteo Rápido. las encuestas con la muestra más pequeña entrevistaron mil personas, de una lista nominal de setenta y nueve millones cuatroscientas mil personas; la representatividad es minúscula. por el otro lado, el Conteo Rápido del IFE observó poco más de siete mil quinientas casillas de un total de cienco cuarenta y tres mil, es decir, más del cinco porciento. estas muestras no son siquiera comparables.

segundo: el grado de sin respuesta es impresionante. en él se incluyen tanto "no votaré", "no quiero contestar"/"el voto es libre y secreto", "anularé mi voto", "no he decidido mi voto". mientras que Covarrubias tuvo sólo un seis porciento de no respuesta, Reforma tuvo más de viente: una de cada cinco personas no le quiso contestar o no había decidido su voto. es decir: el margen de error debe ser impresionante: una de cada cinco personas claramente puede modificar el resultado de la elección. sin embargo, visto como abstinencia, es muy poco. la participación mexicana de tres de cada cinco deben dificultar bastante el levantamiento de encuestas -y la indecisión seguro no ayuda.

por último, retomo una encuesta que entregó el equipo de Andrés Manuel unos días antes de la elección:



El equipo de campaña de Andrés Manuel López Obrador hizo público hoy los resultados de un Estudio de Opinión realizado a Nivel Nacional, en el que el candidato de las izquierdas figura en primer lugar de las preferencias con el 27.8% de la intención de voto, seguido muy cerca del candidato del PRI, Enrique Peña Nieto, quien, ante la pregunta ¿por quién votaría para Presidente de la República si las elecciones fueran hoy?, obtuvo el 26.4% de la preferencia.

La candidata del PAN, Josefina Vázquez Mota, ocupa el tercer lugar con el 18.4% de la intención de voto, mientras que el candidato del Partido Nueva Alianza, Gabriel Quadri, obtiene el 2.5%. Asimismo, el 6.8% de los encuestados dijo que no votaría por ninguno de los cuatro abanderados, el 13.8% apuntó que aún no tiene decidido su voto, y el 4.4% no supo contestar a la pregunta o prefirió no hacerlo.

De acuerdo con el Estudio, la encuesta consta de una muestra de 1,315 opiniones, “lo cual da un margen de error +2.7% con una confianza del 95%”.
observamos más o menos los mismos atenuantes: una muestra pequeña, un margen de error cercano a tres y un porcentaje de indecisos superior al quince -en este caso, veinticinco. sin embargo, está casi tan mal como las otras, incluso haciendo un análisis parecido tendríamos que las preferencias brutas son de setenta y cinco de los encuestados y tendríamos Andrés Manuel treinta y siete porciento, Enrique treinta y cinco punto dos porciento, Josefina veinticuatro punto cinco porciento y Gabriel con tres punto tres porciento. es decir, esta encuesta tuvo que, necesariamente, haber hecho lo mismo pero al revés: entregar para Enrique el valor medio menos el margen de error y para Andrés Manuel el valor medio más el margen de error.

que me lleva a mi pregunta sincera: si la elección pudiera estar impugnada por la excesiva compra de votos, ¿cómo miden eso las encuestadoras? es decir, si tantos como cinco o seis millones de votos fueron comprados, ¿cómo pudieron estar acertadas las encuestas? ¿dónde aparece el voto comprado en las encuestas? ¿desde cuándo decide alguien vender su voto?

en fin. dejo aquí a las encuestas confiando en Grupo Reforma, Covarrubias y María de las Heras y con el claro deseo de abrir mi propia casa encuestadora.


Licencia de Creative Commons
escribesaurio by Uge Saurio is licensed under a Creative Commons Reconocimiento-NoComercial-SinObraDerivada 3.0 Unported License. Creado a partir de la obra en escribesaurio.blogspot.com. Permissions beyond the scope of this license may be available at escribesaurio.blogspot.com.