Desarrollan algoritmo que predice el voto utilizando Ciencia de Datos e IA

En el contexto de próximas elecciones en el país, un equipo multidisciplinario de investigadores e investigadoras de la IBERO CDMX y de la UNAM, diseñaron un algoritmo de análisis y predicción del voto que ha obtenido resultados altamente precisos, tanto en la elección presidencial de 2018, como en el primer debate de las elecciones del Estado de México de este año.

Imagen de referencia de desarrollo de código

La relevancia de este proyecto, destacó el Dr. Mauricio Flores, académico de la recién lanzada Ingeniería en Ciencia de Datos, es que el algoritmo CEO no es una biblioteca que ya está diseñada, sino que “lo estamos codificando de acuerdo a las necesidades que nos van indicando las y los lingüistas” que forman parte del proyecto; es decir, no se basa en criterios ya establecidos, sino que están creando los propios a la medida para este contexto específico.

Además, al detectar tanto opiniones positivas como negativas, este algoritmo permitió al equipo darse cuenta de que la persona candidata con más opiniones positivas suele recibir también la mayor cantidad de opiniones negativas, lo cual funciona como una variable de control.

En el caso de la elección presidencial de 2018, este algoritmo basado en Twitter dio un 44.8% de preferencia de voto a Andrés Manuel López Obrador, 39% a Ricardo Anaya y 16.1% a José Antonio Meade. Al finalizar la elección, se pudo comprobar que esta predicción fue cercana a los resultados reales, de 53.19% para López Obrador, 22.27% para Anaya y 16.4% para Meade.

Durante el primer debate de las actuales elecciones del Estado de México, el algoritmo fue aún más preciso, pues predijo una preferencia de 67% para Gómez y de 33% para Del Moral, y estos datos se aproximaron mucho a los de una encuesta de Enkoll publicada por El Universal al día siguiente: 65% para Gómez y 35% para Alejandra.

Los datos de este proyecto reflejan la tendencia de la elección en un conglomerado determinado de tuits, no son representativos del territorio, advirtieron los investigadores. Sin embargo, admitieron que muchas veces la red social se comporta de una manera similar al territorio. Es decir, aunque no tienen representatividad estadística, muchas veces los resultados son similares a lo final.

Una segunda parte del proyecto se relaciona con emociones discretas en las elecciones, tales como enojo y angustia, lo cual puede ser complicado por fenómenos como la ironía al escribir. Así, se vería cómo esta parte emocional se conecta con la parte de la decisión de las y los usuarios. Y más adelante, explicaron los investigadores, los datos se podrían desagregar en otras variables de interés, como arquetipos de usuario.

Esta es solo algunas de las aplicaciones que la Ciencia de Datos y la Inteligencia Artificial están teniendo en diversos sectores, en este caso en el contexto de elecciones en México.