Instituto Nacional Electoral

Seminario sobre el desempeño del PREP 2006

| Inicio Seminario | Mesa 5 |

Seminario sobre el desempeño del PREP
Llegada de datos al PREP

Presentación

"Llegada de datos al PREP"
Dr. Wolf Luis Mochán Backal
Investigador del Instituto de Ciencias Físicas, UNAM

Dra. Judith Zubieta: Muchas gracias, Enrique, muy amable. Tendremos ahora la participación de mi querido amigo el doctor Luis Mochán, él estudió la Licenciatura en la Facultad de Ciencias de la UNAM, es maestro y doctor en Ciencias por la misma institución; el doctor Mochán obtuvo la medalla Gabino Barrera por su excelencia académica, además de la medalla Marcos Moshinsky del Instituto de Física del a UNAM; actualmente, además de ser investigador, es el Director del Instituto de Ciencias Físicas de la UNAM en Cuernavaca y profesor de la Facultad de Ciencias de la Universidad Autónoma del estado de Morelos.

Trabaja en Física del estado sólido, Física de superficies, propiedades ópticas de la materia y en particular en espectroscopias ópticas líneas y no lineales como RAS, SHG y un montón de letras y siglas más, pero hablan de la sensibilidad a las primeras camadas atómicas en la vecindad de superficies sólidas, un tema en el que todos nosotros somos profundos conocedores, además de algunos trabajos colaterales sobre propagación superluminar, dispersión de ases atómicos por superficies, óptica topográfica, entre otras; ha escrito diversos artículos en revistas especializadas y también participa de manera muy comprometida en labores de divulgación de la ciencia que es muy importante para nuestro país. Entonces, Luis tienes 15 minutos.

Dr. Luis Mochán: Gracias, Judith, muchas gracias por la presentación. De lo que les voy a hablar es un poco cronológicamente de cómo es que me metí en este lío, como les explicó Judith no es a lo que me dedico principalmente, pero básicamente lo que hice es un programa de computadora que capturaba los datos que estaba publicando el IFE en sus páginas del Web y al día siguiente pues empecé a analizarlos y encontré muchas cosas que a mí me sorprendieron, a mí quizá de manera inocente, no correspondían a lo que yo esperaba.

Les voy a mostrar algunas de ellas, y yo creo que son cosas que requieren una explicación, están buscando, demandan una explicación, se han ofrecido muchas explicaciones tentativas, muchas de ellas son razonables, pero en mi opinión todavía no son convincentes, se requiere mucho mayor trabajo de parte de todos los involucrados. Entonces en esta gráfica lo que les estoy mostrando son, mi programa lo que hacía era capturar datos cada cinco minutos y en esos cinco minutos se acumulaba un número relativamente grande de actas, relativamente grande de votos y con un proceso posterior, o que les estoy mostrando aquí es el número de votos por acta, promediado durante cada uno esos intervalos de cinco minutos.

Entonces hay varias cosas raras, digamos, que hay aquí que son las que les quiero mostrar, nunca he intentado dar una charla sentado de espaldas a la pantalla, pero lo voy a intentar. Si aquí, por ejemplo, hay un mínimo en el número de votos por actas que saca el PAN. Un mínimo, el número de votos que saca la Coalición y un mínimo del número de votos que saca el PRI, básicamente, los tres en el mismo lugar, eso salta a la vista, porque o que uno espera es que si uno baja el número de votos, el otro sube el número de votos.

Claro que hay una explicación, si esa casilla, la que estamos viendo es una casilla chiquita con poquitos votos, uno diría bueno, pues ahí todos bajaron su número de votos porque hay muy poquitos para distribuir entre todos los partidos. Pero lo que quiero enfatizar es que estos son datos promediados en cinco minutos y hay del orden de 5 mil casillas ahí metidas. Entonces en lo que nos estuvo reportando el PREP durante la noche de la elección ahí cuando iban alrededor de 60 mil casillas, de repente llegaron 5 mil casillas con un número muy reducido de votos, todas al mismo tiempo. ¿Por qué? Quién sabe.

Bueno, esto, lo que estoy mostrando aquí son los datos de la base de datos del PREP que liberaron varios días después y que yo empecé a procesar mucho tiempo después y no hay tal cosa, o sea, lo que estamos viendo es la gráfica anterior, no la hay, aquí hay 2, hay pares de curvas, una promediada cada mil casillas, otra promediada cada 5 mil casillas, se ven fluctuaciones estadísticas, pero nunca se ve una caída que dure del orden de 5 mil casillas correlacionada entre todos los partidos. La gráfica tomada de las bases de datos no corresponde a la gráfica tomada de las pantallas que nos mostró el IFE durante la noche.

Otra cosa que quiero que vean aquí, es lo que sucede al final. Lo que sucede al final son una serie de puntos que no se pueden graficar, porque de repente obtuve, digamos, 6 mil votos por acta, de repente obtuve 300, 500 votos por acta, pero negativos, esos son números totalmente absurdos. El primer sospechoso fue mi programa, dije, estoy contando mal, estoy sumando mal, estoy extrayendo mal los datos de las páginas Web del IFE.

Pero si pasamos a la siguiente, pues no es cierto, aquí les puedo mostrar, no sé si lo alcancen a leer, pero son copias de dos páginas del IFE, separadas del orden … no recuerdo si una hora ó media hora, no alcanzo a leer desde aquí, y lo que ven es que cuando iban a las 12:39 del día 3 de julio había 127 mil 772 actas procesadas y a las 13.50, o sea, una hora después, poco menos de una hora después había 127 mil 713, o sea, que se pedieron actas.

Entonces lo que nos estaban mostrando de repente el número de actas que llegaron fue negativo; claro, eso es un error en la presentación de los datos, no es algo que nos deba quitar el sueño, pero es un error que muestra que en la presentación de los datos sí hubo intervención, sí hubo manipulación, no sé que hubo, se descompuso la computadora, la imagen que tengo en la cabeza es que alguien se le chorreó la tasa de café encima del teclado y cambiaron de computadora.

¿Pero cuál fue la respuesta que tuvimos? Hasta no ver las recomendaciones del Comité Técnico, que las vi hace poco, yo no había visto a nadie que mencionara esto, y más bien nos echaron una propaganda, una campaña, diciendo que: “por el hecho de dudar del IFE somos malos mexicanos”. Entonces yo quiero que vean que al menos en el reporte de los datos sí hubo errores, que es el puro reporte. Yo no tenía todos los datos, sino obtenía datos a partir de alrededor de 10 mil casillas, y son los que estoy mostrando en la siguiente gráfica.

Claro que todos los datos tienen que partir de cero, había cero votos cuando había cero actas y entonces lo que hago en esta gráfica es simplemente trazar una línea recta del primer punto que tengo para el PAN a cero, que tiene que ser uno de los datos, y lo que ven es que es una línea recta perfecta, y a diferencia de lo que dijo Héctor Riveros hace rato, yo creo que es lo que uno debe esperar, o sea, es el número de votos totales acumulado como función del número de actas totales que se han procesado, pues uno esperaría que sea una línea recta con unas cuantas fluctuaciones arriba y abajo.

Entonces el PAN es una línea recta. Si hacemos lo mismo con el PRI… bueno, yo no lo veo, no sé si ustedes lo ven, por aquí debería haber una recta que se siga hacia acá, y bueno, el PRI no sigue la recta, disculpen que no es buena la imagen, no sigue la recta, pero lo que sucede es que el PRI gradualmente fue obteniendo más y más y más votos, entonces se comparta más como una parábola que como una recta, pero se va alejando de la recta suavemente. Si hago el mismo el mismo ejercicio para la Coalición por el Bien de Todos, no se parece en absoluto. Eso quiere decir que no podemos extrapolar de las segundas 10 mil casillas a las primeras 10 mil casillas, porque el comportamiento es totalmente distinto.

Ahora, si tratamos de hacer esa extrapolación del lado derecho, hacia el lado izquierdo, adelante, si hacemos esa extrapolación entonces el PRD no empezaría en ceros sino que empezaría con número negativo, y el número negativo que sale, pues a mí me despertó una cierta suspicacia porque salió del orden de un voto por casilla, salió 120 mil. ¿Qué significa? No sé, pero en las primeras 5 mil, 10 mil casillas, el comportamiento del PRD fue sumamente distinto, mientras que el del PAN fue exactamente igual que el de las siguientes 10 mil casillas.

Bueno, si nos vamos hasta las 70 mil, la recta que describe al PAN se sigue tal cual, el PRD sigue siendo una recta, o sea, de 10 mil a 70 mil, el PRD se comporta como una recta perfecta, pero de cero a 10 mil se comporta de manera muy peculiar y el PRI sigue siendo básicamente una curva suave, una especie de parábola. Bueno, otra cosa que a mí me llamaba mucho la atención, que simplifica un poco en esta gráfica, es la diferencia en el número total de votos acumulados, con fusión del número de actas procesadas.

Entonces, lo que vemos es que el PAN gradualmente se va alejando, le va sacando más y más, y más votos al PRI, hasta que de repente, cerca de las 70 mil actas computadas, hay un cambio abrupto en el comportamiento, y luego, después de cerca de las 100 mil actas procesadas, hay otro cambio abrupto en el comportamiento. Entonces, en la región de en medio, el PRD va remontando la ventaja que le llevaban, y de repente, la deja de remontar.

Esto, la explicación que se ha repetido muchas veces, la acabamos de oír ahora, es que es esta diferencia entre rural y urbano, y de la geografía, la geopolítica. Esta no se le va a entender nada, pero básicamente son una crucecita por cada estado de la República, numerado de abajo hacia arriba, del uno al 32. Lo que quiero que vean aquí es que cerca de las 100 mil casillas, el Distrito Federal, el Estado de México se acabaron, y al acabar puede ser algo abrupto, porque lo que yo me imagino es que en estos centros de captura de datos hay una pila de paquetes retrasados, y van acabando, están procesando a toda velocidad, y de repente, agarran el último paquete y ya no hay más.

Entonces, abruptamente, aunque los paquetes llegan gradualmente, se pueden terminar abruptamente. Eso podría explicar muy claramente porqué esto que fue muy sorprendente inicialmente, por qué en este punto se revierte la tendencia. Lo que iba ganando el PRD, de repente lo deja de ganar, pues porque se acaba el voto del Distrito Federal, se acaba el voto del Estado de México. Pero el punto anterior, el quiebre anterior, es sumamente abrupto, es un cambio de pendiente que se da lugar en menos de 5 mil casillas; hay un cambio muy, muy abrupto, y en lo que yo he explorado no hay nada que cambie abruptamente en la distribución de llegadas, en la distribución de rurales, urbanos; no hay nada que cambie tan abruptamente, alrededor de esas 70 mil casillas.

Bueno, aquí quiero mostrarles otra cosa, que la mencioné brevemente en la mañana. Una de estas curvas es la que les acabo de mostrar, que debe ser esta de aquí, que soy daltónico, no sé qué color sea; pero lo que hice fue trazar otras curvas seleccionando subconjuntos de actas. Entonces, por ejemplo, si hago el resultado de la votación, la diferencia entre el PAN y el PRD, como fusión del número de actas procesadas, pero tomando únicamente aquellas actas que son inconsistentes, donde la suma de los votos es distinta al número de boletas que reportaron como encontradas en la caja, el resultado es esta curva que apenas si se ve aquí; debería ser una curva amarilla, no sé si la ven aquí abajo, pero que muestra que sobre esas actas, quien hubiera ganado es el PRD.

Lo que yo hubiera esperado es que al tomar un subconjunto del total de datos, lo que hubiéramos obtenido es una fracción, o sea, la curva simplemente se hubiera escalado, hubiéramos obtenido la misma curva con un factor de escala. No obtenemos eso; obtenemos un resultado totalmente distinto, incluso de signo distinto. Eso quiere decir que seleccionar actas debido a las inconsistencias o seleccionar actas debido a que están incompletas, son las otras curvas que tengo mostradas ahí, no es un buen muestreo de la población.

Ahora ¿por qué no? ¿Será que nada más en las regiones perredistas se cometen inconsistencias? Eso, para mí, que es una duda que se tiene contestar. También se ha hablado que estos cambios de comportamiento pueden ser debido al cambio entre rural y urbano, entonces aquí lo que hice fue separar al D. F., nada más para mostrarle que en el Distrito Federal, en el mismo lugar, hay un cambio de comportamiento, un cambio abrupto de pendiente; hay alrededor de las 60 mil, 70 mil actas, y que está coordinado con el mismo cambio en todo el resto de la República. ¿Por qué el D. F., que tiene tan poquita población rural tiene ese cambio abrupto al mismo tiempo? Para mí sigue siendo un misterio.

Bueno, entre los datos que publicó alguna de las bases de datos del PREP, que yo no fui consciente de ello hasta el final, además de aparecer el tiempo en que se capturaron los datos, aparece el tiempo en que llegaron las distintas actas a los CEDAT’s, a los centros donde capturaban los datos, y entonces aquí les muestro una gráfica donde en el eje horizontal está el tiempo en que llegó el paquete al CEDAT y el eje vertical está el tiempo que tardó el paquete, sentado ahí en una mesa, esperando que lo capturaran.

Lo que pueden ver aquí es que durante la noche del 2 de julio y la madrugada del 3 de julio, en esta región de aquí, pues se acumularon muchos paquetes. Los paquetes cada vez tardaron más, tardaron más en procesarse, porque se estaban acumulando. Algo que muestra esta gráfica es que no siguieron ningún protocolo para la elección de qué paquete debían procesar. Deberían haber usado, tengo entendido, un protocolo al que llaman FIFO, o sea, el primer paquete que llegó es el primero que debe ser procesado.

Si hubieran hecho eso, entonces todos los paquetes hubieran sufrido un retraso en esa región, y no es así. Algunos paquetes salen inmediatamente y otros paquetes tardan del orden de tres horas, cinco horas. Probablemente no lo vean, pero por aquí hay algún puntito que tardó 21 horas en ser procesado, y entonces, si hubieran usado el otro algoritmo, el last in first out, el último que llega es el primero que procesan, entonces en el momento en que estaban llegando dichos paquetes pues algunos se procesarían muy rápido, pero todos los demás quedarían retrasados y de cualquier manera tendríamos un hueco blanco en esa región, en esta curva, y no se ve.

Eso quiere decir que, o los agarraron al azar, o los agarraron con un criterio totalmente extraño. Algo que se ve curioso aquí son estos como pelos, estas líneas verticales, y esas líneas verticales indican que hubo muchos paquetes que llegaron a la misma hora y se procesaron a distintas horas, cada uno con un retraso distinto, y eso es curioso porque de ver este tipo de gráficas, en alguna ocasión Víctor Romero especuló que los paquetes llegaban en camioncito, y luego nos confirmaron que efectivamente los traen todos juntos, y entonces hay muchos paquetes con la misma hora de llegada y distintas horas de proceso.

Pero lo que les quiero mostrar en verdad es la gráfica que sigue, que es el resultado de la elección como función del tiempo, pero no como el función del tiempo de llegada del paquete, porque este tiempo de llegada del paquete, como se ha discutido, a lo mejor depende de la geografía, depende del tipo de población, depende de muchas cosas. El eje horizontal en esta curva que estoy mostrando, es el tiempo que tardó el paquete en ser procesado, en ser capturados los datos.

Entonces los paquetes que tardan menos de seis minutos en ser procesados, que es esta región de aquí, lo que vemos es que gana el PRD por un poquito. Los paquetes que tardan entre seis minutos y una hora, gana el PAN por un poquito. Los que tardan de entre una hora y tres horas, vuelve a ganar el PRD por un poquito, y los paquetes que tardan más de tres horas en ser procesados gana el PAN por mucho, gana por 17 por ciento, y el número de votos que le saca el PAN al PRD en esta región, pues es del orden de 100 mil votos.

¿Por qué hay una correlación, una relación pues, entre el tiempo que tarda un paquete sentado dentro de una mesa, esperando que el capturista tome los datos, y la preferencia electoral que muestra ese paquete? Para mí sigue siendo un misterio también. Esto me lo salto, porque ya se acabó el tiempo y lo mencionó Víctor brevemente. Adelante, yo creo que ya me voy hasta las conclusiones del final.

Bueno, entonces el reporte del PREP la noche de la elección tiene diferencias con la base de datos. Tiene correlaciones y errores que muestran que en el reporte al menos hubo interferencia. Las primeras 10 mil actas son muy distintas que las demás para la coalición, pero no para los otros partidos. La diferencia entre el PAN y la coalición tiene cambios abruptos, y las explicaciones tentativas que tenemos a la mano me parece que no son convincentes, por lo abrupto del comportamiento.

Las actas inconsistentes, las actas incompletas arrojan resultados distintos. No entiendo por qué habría de haber una correlación entre el resultado electoral y la capacidad de llenar o no llenar bien las actas; y la preferencia, bueno ese último punto no lo discutí, así es que aquí concluyo. Gracias.

| Inicio Seminario | Mesa 5 |

Subir

2012

Nos interesa tu opinión: