"Análisis estadístico de los resultados publicados por el PREP"
Mtro. Enrique Espinosa y Act. Carmen Cárdenas AC Nielsen
Dra. Judith Zubieta: Muchas gracias al doctor Víctor Romero, una disculpa por la insistencia en el tiempo. Ahora vamos a escuchar la presentación de la Empresa A. C. Nielsen. Nos acompañan en esta mesa Carmen Cárdenas y Enrique Espinoza, a mi derecha.
Carmen Cárdenas es actuaria egresada de la Facultad de Ciencias de la UNAM; ha trabajado en diversas dependencias como el INEGI, el Instituto Mexicano del Seguro Social realizando análisis estadístico; ha laborado de igual manera en la iniciativa privada, en Berumen y Asociados y actualmente se encuentra trabajando en A. C. Nielsen, empresa dedicada al análisis e investigación de mercados.
Enrique Espinoza, por su parte, también es actuario titulado, pero no de la Facultad de Ciencias, del Instituto Tecnológico Autónomo de México (ITAM) y tiene una Maestría en Finanzas por la misma institución. Durante su trayectoria laboral se ha desempeñado principalmente en el área de investigación de mercados prestando sus servicios a empresas como Televisa Corporación y A. C Nielsen, dentro de las cuales ha realizado diversos estudios estadísticos con metodologías de regresión, muestreo y análisis de series de tiempo.
Actualmente ocupa el cargo de Director de Cuenta para A. C. Nielsen México. Entiendo que Enrique hará la presentación, entonces es tuya la palabra. Muchas gracias.
Mtro. Enrique Espinosa: Muchas gracias. Bueno, pues quisiera iniciar agradeciendo al IFE por esta invitación y también tocando un poquito el tema de porqué nosotros nos metimos en estos análisis; Nielsen no había entrado en ninguna parte de los conteos rápidos que se hicieron en 2006, precisamente manteniéndonos al margen, pero resulta que, un poco retomando la cuestión del PREP, que se planteaba en la mañana, en donde el PREP se plantea como uno de los cuatro instrumentos que buscaban dar transparencia en la comunicación de los resultados hacia los ciudadanos.
Nosotros tomamos este PREP precisamente como eso, como uno de esos instrumentos. En el momento en el que empezamos a oír ciertas reflexiones sobre, bueno, inconsistencias que se pudieran estar dando en esta captura en el PREP o en la forma en la que estaban llegando los datos, pues como decía Javier Aparicio, de pronto ya no pudimos dormir. Entonces, era un poco más rentable no dormir una noche haciendo un análisis que dejar de dormir unas cuantas semanas, sin saber realmente qué había pasado. Entonces, por ahí fue principalmente el móvil de este análisis.
Entonces, si entramos un poquito más a detalle. Las reflexiones que nosotros estábamos tratando en esta presentación eran: Uno, qué tanto implicaba tomar cortes del PREP o qué tanto se podía tomar estas muestras de cortes en el PREP, como muestras aleatorias que pudieran ser representativas de los resultados a total nacional. Por otro lado, también había por ahí alguna reflexión en donde se planteaba que se habían dado muy pocos cruces o ningún cruce, al momento de la apertura del PREP al momento de las ocho de la noche y no se había dado ningún cruce entre las preferencias de los dos principales partidos, y que eso sonaba algo extraño. Entonces, son los dos temas que vamos a empezar a tratar.
Lo primero, es qué sabemos. Lo primero que sabemos es lo que ya hemos venido viendo a lo largo de todas estas presentaciones; sí, por ahí hubo algún corte en las preferencias del PREP, que es el que estamos viendo hasta la izquierda, pero esto, la población, digamos, no lo pudo percibir, ¿por qué?, porque las cifras todavía no se estaban publicando a esa hora, dado lo que marcaba la ley. Después, encontramos cómo el PAN llega a cierto pico, y empieza a converger y la distancia entre PAN y Alianza Por el Bien de Todos, la Coalición Por el Bien de Todos, empieza a cerrarse la diferencia. También sabemos, de acuerdo a los mapas que observamos, cómo nuestro país estaba dividido en dos; 16 entidades daban como favorito a un candidato, 16 estaban dando otro.
También sabemos, lo que estamos viendo del lado izquierdo, cómo las preferencias dependiendo de casillas urbanas o no urbanas, entre los dos principales partidos, tendían a hacer una diferencia. De aquí, el primer hallazgo o la primera cuestión que tendríamos que tomar en cuenta es, entonces, una muestra aleatoria, o cualquier muestra, ya sea aleatoria, probabilística, no probabilística, que quisiera representar el comportamiento del país, realmente debería de estar contemplando estas dos cuestiones: Uno, la dispersión por entidad federativa; dos, el hecho de contemplar tanto casillas urbanas como no urbanas.
Entonces, la reflexión aquí es, bueno, ya vimos que el PREP, en algún momento, llegó a tener una mayor proporción de casillas urbanas, mayor proporción de algunos estados, en las diferentes ponencias, pues es en qué momento pudiéramos esperar ya obtener una muestra, o sea, tener los elementos suficientes para ya obtener una muestra que pudiera ser representativa del resultado final. Entonces, lo que nosotros estamos haciendo y lo vamos a utilizar; vamos a utilizar ciertos cortes de interés.
Nosotros analizamos cinco cortes de interés en donde, bueno, el primero es el único momento en el que se están cruzando las preferencias; el siguiente corte, que es el dos, el que tienen indicado en la gráfica, es en el momento en el que el PAN estaba teniendo uno de sus mayores niveles en las preferencias. Después, ya estos, los dos siguientes cortes, van más sobre una metodología estadística, el tres y el cuatro, que es donde nosotros, de acuerdo a unas pruebas.
Ahora voy a explicar qué pruebas de bondad de ajuste, estamos encontrando que las proporciones, por entidad federativa, que es el corte número tres, ya se parecían a las proporciones que pudiéramos esperar de representatividad del país, y en el corte número cuatro es cuando nosotros ya logramos un ajuste entre casillas urbanas y no urbanas.
El último corte, el corte cinco, es meramente informativo; de hecho, aquí ya no vamos a abundar mucho en él, pero es en un momento en el que todavía se ve ese pedacito, incluso en la presentación de Víctor Romero se veía, ese pedacito donde el PAN como que retoma un pico interesante. Entonces, si vamos un poco más adelante, explico esta parte de lo que les comentaba de la prueba de bondad de ajuste. Ya se vio un poco al principio. ¿Para qué nos sirve esta prueba principalmente? Nosotros tenemos, sabemos que existe una proporción; los estados tienen cierto peso digamos, en cuestiones de la lista nominal. Cada estado va a aportar cierto porcentaje al total nacional.
La prueba de bondad de ajuste nos permite saber en el momento de que teníamos las casillas del PREP, qué tanto se parecía la proporción de lo que estábamos recibiendo a la proporción de lo que estaríamos esperando. Esto se hace tanto por entidad como por casillas urbanas y no urbanas. Esas son en general las dos pruebas que estamos haciendo, la prueba 1, la prueba 2, en donde estamos hablando de cómo estaríamos manejando dos “ji2”, cada una con ciertos grados de libertad, y vamos a encontrar un valor crítico para rechazar o no esta prueba.
Ya entrando a detalles, a los cortes. Lo que nosotros estamos viendo es, de acuerdo a lo que se procesó en el PREP, y conforme lo vayan viendo ustedes. En el corte uno, que es el de las 19:40, realmente votos procesados eran muy pocos, era justo el momento en donde se estaba dando ese cruce de las preferencias. Vean cómo es el .003 por ciento de los votos lo que apenas se había procesado.
En ese momento, nosotros corremos estas pruebas de bondad de ajuste, y nos damos cuenta que, esos dos cuadritos rojos que están viendo abajo, pues no cumple, esta muestra no tiene ni siquiera el mismo peso o la misma representatividad. Estoy abusando un poco de temas de representatividad pero digamos, las mismas proporciones que esperaríamos para los estados y las mismas proporciones que esperaríamos para una casilla urbana o no urbana.
Es decir, esta muestra podría ser, ese .03 por ciento de los votos podría ser completamente, y voy a poner el caso más drástico, que no es lo que fue, de un solo estado y de un solo tipo de casilla. Después estaríamos llegando al siguiente corte, el corte de las 21:00 horas, en donde se había procesado un 2.85 por ciento de los votos. Ahí estamos acumulando los votos, con ese 2.85 por ciento de los votos notamos que es donde llega a su máximo nivel las preferencias por el PAN. Pero tampoco tenemos un ajuste, ni en tipo de casilla ni en entidad federativa. Nos seguimos a lo que sería el corte de las 23:00 horas.
En ese corte de las 23:00 horas, ya tenemos un 32 por ciento más o menos de los votos procesados, y ya empezamos a ver cierto ajuste. El ajuste se está dando más hacia el nivel entidad federativa, pero todavía nos dice que por el lado de las casillas pudiéramos estar teniendo más o menos urbanas o no urbanas de las que estaríamos esperando.
Finalmente, cuando tenemos el corte de las 4:40 ahí es cuando logramos el ajuste. Pero vean ya qué proporción de los votos están procesados, realmente es el 90 por ciento. Es algo que con la lógica podríamos decir bueno, si ya procesaste un 90 por ciento de tu muestra, pues ya esperarías que pudieras empezar a lograr este ajuste.
¿Qué sucede entonces de ese punto hacia atrás? Cualquier muestra que pudiéramos estar tomando, realmente no podría estar tan robusta, no sería tan robusta como para representar ni siquiera las entidades, si tomamos los dos primeros cortes, o el tipo de casilla, si tomamos los tres primeros cortes. Entonces apenas hasta este momento, es decir, cortes de las 4:40 y de manera acumulada, no cortes puntuales, un corte acumulado, es donde pudiéramos estar generando muestras que nos pudieran empezar a dar pistas del resultado final.
Finalmente, el otro corte, que es el de las cinco de la tarde, vean cómo también ahí, perdón, de las 15:40, el quinto corte, también tenemos un ajuste, dado que ya los votos procesados eran muy cercanos. Vamos a retomar un poquito los cortes, la gráfica anterior fue un poco el resumen. Vámonos el slide que sigue por favor, que ese es el corte que vamos a analizar, de las 21 horas, voy a abundar un poco más en él.
Ahí lo que tenemos, del lado izquierdo ustedes van a encontrar lo que se había procesado, o sea, los resultados que estaban arrojando los votos procesados hasta ese momento, y del lado derecho es lo que no se había procesado. Ahora nosotros podemos replicar este análisis, dado que tenemos los dos lados. Pensando que alguien hubiera hecho un muestreo, y que esto hubiera empezado a llegarle poco a poco, pues sólo habría contado con la parte del lado izquierdo, lo cual no te podría dar mayor información mas que lo que está ahí.
Resulta que cuando vemos esos votos procesados es cuando teníamos esas mayores preferencias por el PAN, cuando estábamos llegando al pico máximo, pero vean cómo es el 2.85 por ciento; del lado izquierdo, lo que ustedes van a ver, ahí hay dos arañas digamos, un radar. El radar del lado izquierdo, la parte roja es la proporción que nosotros estaríamos esperando para cada estado. Eso es lo que nosotros sabemos, de acuerdo a la lista nominal, que estaría pesando cada estado, y luego la línea morada lo que nos dice es la proporción que estamos recibiendo en el PREP. Vean cómo estados del norte son los picos esos que estoy marcando ciertos círculos, son los estados que están recibiendo proporciones mayores a las que estaríamos esperando, es decir el caso de Coahuila, Tamaulipas o incluso Nuevo León.
¿Esto que nos dice? Dado que sabíamos por el mapa que vimos al principio, que el PAN tenía mayores preferencias ahí, pues esto nos está indicando el por qué el PAN en ese momento tenía un pico importante. ¿Por qué? Porque estábamos teniendo mayor proporción de estados panistas, simple y sencillamente. Nada más, no está diciendo nada más esto.
La que sigue ya es el corte de las 4:40. El de las 21 horas, la gráfica anterior era entidad federativa. Este es el tipo de casilla urbana-no urbana. Del lado izquierdo, en la barra, tengo la proporción esperada y vean cómo se veía la posición de procesados al corte, o sea, realmente el 94 por ciento de las casillas procesadas en ese momento provenía de casillas urbanas y está perfecta, de ahí que la prueba de bondad de ajuste no nos esté dando para los no procesados y en cambio para los procesados, que es la del lado derecho, la barra hasta la derecha, la prueba de bondad de ajuste, que son las que tengo en las tablas de a un lado, es las que nos están ajustando. Esto nos diría, lo que nos falta es lo que realmente sabemos que va a pasar, lo que tenemos no nos dice nada.
Vámonos al corte de las 4:40. Me estoy saltando unos cortes precisamente por cuestiones de tiempo, tenemos todos los cortes por aquí, pero el de las 4:40, porque es cuando ya estábamos logrando el ajuste, tanto a nivel entidad federativa como a nivel casilla urbana y no urbana, y aquí la parte relevante es vean cómo, cuando ya tenemos una muestra un poco más representativa de estos dos conceptos que he venido hablando, la parte del PAN, las preferencias hacia el PAN ya se muestran superiores a las preferencias de la Coalición por el Bien de Todos, que es la gráfica que tengo del lado izquierdo.
Del lado derecho lo que me faltaba procesar, ahí incluso las preferencias eran favorables al PRD o a la Coalición por el Bien de Todos, sin embargo por el tamaño del país, por el tamaño del pastel de lo que me falta, realmente ya se antojaba, es lo que nos cierra el GAP, pero ya no revierte la tendencia, de acuerdo a los resultados que estuvimos viendo en el PREP.
Noten cómo ahora la que se ve rara o la que se sale de las proporciones es la araña del lado derecho. Ahí, en el lado derecho lo que tengo son estados como Veracruz, como Chiapas, como Oaxaca, incluso Sinaloa, que son los que se están tardando más en llegar, o sea, el lado derecho es lo que yo no procesado y de acuerdo a lo que yo no procesado todavía me falta proporciones interesantes de no procesar o procesar más bien, por el lado de esos estados. Algunos explican, precisamente por aquí en la tarde estuvimos comentando, qué tan marginadas están esas áreas o cuestiones como el caso de Sinaloa donde los usos horarios son distintos, lo cual te da una idea de que esto pudiera estar retrasando esa llegada.
Ahora vean también otra cuestión que nos estuvieron explicando estas preferencias, cómo la parte de la proporción de lo que ya capturamos, ya se parece bastante, si bien es cierto que ya aquí la prueba nos dio, en lo procesado, ya nos dio que sí estamos teniendo un ajuste, pero la parte no procesada es evidente que está muy predominantemente sobre casillas no urbanas.
Otra vez nos hace lógica el hecho de que casillas no urbanas estén llegando hasta el final y el hecho de que esas mismas estén marcando una preferencia hacia la Coalición por el Bien de Todos. Con esto principalmente cerramos esta parte de las proporciones, este es un ejercicio ya más teórico, en donde nos planteamos qué hubiera pasado si la información del PREP se hubiera dado en otro orden, es decir, justo las últimas casillas hubieran sido las primeras y las primeras hubieran sido las últimas.
De entrada, bueno, la gráfica de captura, como las últimas casillas están aportando una proporción baja de votos, es por eso que la ven digamos aplanada y las últimas están aportando mucho más, ¿por qué? Porque es el grueso de cuando llegaron las votaciones, las casillas. Es decir, esa si la voltean y luego le vuelven a dar otra vuelta y queda ahí, la misma que la del PREP.
El punto interesante viene en la siguiente, ya nada más para terminar y ven cómo aquí se dan mucho más cruces, o sea, al final siempre estaríamos encontrando mucho más cruces en esta forma de captura. Lo único que nos dice es cuando tienes porcentajes de votos muy bajos, porque vean la barra verde, cuando tienes porcentaje de votos muy bajos, es cuando estás encontrando esos cruces en mayor medida y la manera en que se vuelve más robusta esta medición, pues ya el corte es cada vez menor.
Entonces hicimos el mismo ejercicio nada más que analizándolo en grandes cortes, y también aquí pueden ver ustedes cómo los cortes en los tiempos proporcionales a la captura directa también hay cruces en las preferencias, es la parte de arriba, la parte de la captura inversa ahí también estamos observando cortes. Al final entonces lo que nosotros estamos concluyendo es, bueno, las casillas que llegan al PREP efectivamente conforman una muestran, pero ésta no es una muestra probabilística. Es decir, no podemos aplicarle todos estos criterios o todas estas mediciones que normalmente aplicaríamos hacia una muestra de este tipo.
Lo anterior, bueno, pues está, nos lleva a que precisamente estas muestras pues no estarían cumpliendo, las muestras que se tomaran en parte de corte, no estuvieran cumpliendo con la representatividad y que el mismo PREP, si bien es cierto que se ve por ahí cierta captura sistemática, que podemos llamar sistemática, más bien nosotros lo consideramos como un reflejo de la operación, es decir, qué tan lejos, qué tan alejados, qué diferencia de usos de horarios había para que esas casillas llegaran o no llegaran primero o hasta el final. Gracias.
|