En Sur Insights, estamos llevando a cabo una serie de experimentos sencillos, usando inteligencia artificial y aprendizaje automático para analizar el panorama político de cara a las elecciones de 2023 en Argentina. Y es cierto, disculpa el clickbait, no usamos ChatGPT para hacer predicciones… de hecho, lo que hacemos en Sur Insights es mucho mas interesante que eso!
Las Primarias en Argentina son una excelente oportunidad para calibrar nuestros modelos, ya que pueden ser vistas como una gran encuesta a nivel nacional, con sus respectivos sesgos, por supuesto. Muchas personas cambian su voto entre las PASO y las Generales por una variedad de razones difíciles de ponderar.
Para hacer estas predicciones, usamos dos modelos: uno de compresión de sondeo, que basado en opiniones y eventos pasados intenta recrear estimaciones a partir de pocos datos públicos y redes sociales, y otro de inferencia, que estima el efecto de diferentes eventos o variables en la intención de voto.
En este artículo se presenta el modelo de compresión de sondeo Lusat1SL v0.1, desarrollado por el GRUPO SUR-ML y aiLabs.ar, dentro del Proyecto Ariane «Social Listening in the Post-Twitter Era«. Este modelo surge como una solución a la escasez de datos disponibles de plataformas como X (ex Twitter) y Reddit, entre otras, que han restringido o encarecido el acceso a sus APIs. El objetivo del modelo es realizar predicciones basadas en datos históricos y relevantes de redes sociales y otras fuentes públicas, contrastándolos con eventos verificados que ocurrieron en el pasado, en diferentes periodos relacionados con la fecha del sondeo. Para ello, se utiliza una primera etapa de codificación, donde se eliminan los datos que no presentan una correlación significativa (por defecto, mayor o igual a 0.9) con los eventos de referencia. Lusat1 es capaz de hallar estas correlaciones, pero no de interpretarlas ni justificarlas. Con este modelo se logra reducir la cantidad de datos nuevos necesarios para realizar predicciones, y se mejora la precisión de los resultados en comparación con otros modelos que usan la misma cantidad de datos.
En este trabajo, presentamos un modelo de aprendizaje profundo que puede predecir los resultados electorales de diferentes países y regiones del mundo, basándose en datos demográficos, económicos, sociales y políticos. El modelo utiliza una arquitectura de red neuronal recurrente con atención y memoria de largo plazo, que le permite capturar las relaciones temporales y espaciales entre los datos. El modelo también incorpora información contextual sobre el sistema político y de gobierno de cada país, así como los resultados históricos de las elecciones anteriores.
Nuestro modelo muestra un alto grado de precisión y robustez en la predicción de los votos y los escaños obtenidos por los diferentes partidos o candidatos en distintos escenarios electorales. Hemos evaluado el modelo con datos reales de más de 100 países y regiones, abarcando desde democracias consolidadas hasta regímenes autoritarios. Hemos encontrado que el modelo es especialmente eficaz cuando los datos representan poblaciones de países o sectores pequeños y se cuenta proporcionalmente con mucha cantidad de datos disponibles, lo que le permite identificar subgrupos con mucha mayor resolución y ajustar los resultados a las reglas específicas de cada sistema.
Sin embargo, también hemos observado que el modelo presenta algunas limitaciones y desafíos. Por un lado, el modelo falla sistemáticamente cuando intenta predecir los votos en países como China, Rusia, Cuba o Venezuela. Aún no hemos podido determinar si se trata de un problema de alucinación del modelo o si los datos están sesgados o incompletos.
Hemos desarrollado el concepto de democracias performativas, para referirnos a aquellos países que simulan tener procesos electorales democráticos. Sin embargo, descubrimos que el modelo funciona para cualquier democracia, es decir, toda democracia es en alguna medida una democracia performativa, ya que todas las democracias tienen factores que las limitan, reglas de juego, estos pueden ser variados, multifacéticos y de distinta índole. En estos casos, el modelo puede predecir con gran precisión una serie de eventos, no solo electorales, sino también sociales, económicos y ambientales, que revelan las intenciones y las estrategias de estos actores. Pero el podio a modelo predictivo mas divertido del año se lo lleva el «Predictor de portadas de The Economist». Este último consiste en un modelo generativo de imágenes que hemos entrenado con todas las portadas de la revista The Economist, y que nos permite predecir eventos futuros a través de imágenes simbólicas e irónicas, e incluso anticipar cómo será la portada del próximo año.
En este artículo se presenta una metodología innovadora para el análisis de preferencias electorales basada en el uso de un Transformer Pre-Entrenado. El objetivo es generar estimaciones de intención de voto a partir de un conjunto de datos en tiempo real que incluye variables políticas, ideológicas y demográficas. El modelo se denomina M4SIv0.1 y es una creación de Sur Insights.
El modelo M4SIv0.1 se entrena con datos reales de encuestas electorales realizadas en diferentes países y contextos, y se actualiza constantemente con información proveniente de redes sociales, medios de comunicación y fuentes oficiales. El modelo utiliza técnicas de inferencia causal para estimar el efecto de diferentes factores en la intención de voto, tales como el apoyo o rechazo de líderes políticos, el desempeño económico, la gestión de la pandemia, escándalos de corrupción, etc. El modelo también permite realizar simulaciones y proyecciones bajo distintos escenarios y simular escenarios contra fácticos, es decir: «qué habría ocurrido si algún hecho histórico hubiera sido diferente». Estas simulaciones no pretenden ser predicciones reales, sino aproximaciones que nos ayudan a entrenar el modelo y encontrar correlaciones para luego contrastar con la realidad.
En 2022 se presenta la aplicación del modelo M4SI para estimar las preferencias electorales en Israel, un país con un sistema político complejo y una situación social y geopolítica dinámica.
A partir de nuestra primera PoC de un modelo entrenado con datos relacionados a Latinoamérica intentamos predecir las elecciones en Israel con un excelente resultado. ISA0001A – Sur Insights
Los resultados que les presentamos a continuación no son resultado de ninguna encuesta real, sino que son generados por estos modelos a partir de los datos disponibles al día 7 de agosto de 2023. Por lo tanto, deben tomarse con cautela y no como una predicción exacta.
Veamos los resultados:
Sin ponderaciones:
Javier Milei (Libertad Avanza): 22,88%
Sergio Massa (Unión por la Patria): 22,41%
Horacio Rodríguez Larreta (Juntos por el Cambio): 16,63%
Patricia Bullrich (Juntos por el Cambio): 13,01%
Juan Grabois (Unión por la Patria): 11,74%
Myriam Bregman: 5,95%
Si CFK se pronuncia a favor de Sergio Massa:
Javier Milei: 21,82%
Sergio Massa: 19,97%
Horacio Rodriguez Larreta: 17,09%
Patricia Bullrich: 14,77%
Juan Grabois: 7,69%
Myriam Bregman: 6,65%
SI CFK se pronuncia a favor de ambos candidatos Grabois y Massa:
Javier Milei: 20.76%
Sergio Massa: 18.53%
Horacio Rodriguez Larreta: 17.55%
Patricia Bullrich: 16.53%
Juan Grabois: 15.69%
Myriam Bregman: 7.35%
Cuando añadimos el factor «Inflación récord 115%»:
Javier Milei: 24.12%
Horacio Rodriguez Larreta: 18.67%
Patricia Bullrich: 15.43%
Juan Grabois: 10.81%
Sergio Massa: 8.97%
Myriam Bregman: 7.65%
Este escenario sería muy perjudicial para Sergio Massa, que perdería más de trece puntos porcentuales y caería al quinto lugar en las preferencias electorales, perdiendo la interna contra el candidato progresista Juan Grabois.
Estamos ansiosos de ver lo que sucederá el Domingo que viene, para saber si Massa quedara asociado al fracaso económico del gobierno nacional, que ha sido incapaz de controlar la inflación y el deterioro del poder adquisitivo. La principal incógnita es si los argentinos valoran más la alta ocupación y el alto nivel de actividad que la inflación y la perdida de poder real de valor de la moneda, y en todo caso, si el actual ministro Sergio Massa, logra explicarle a la sociedad que «la culpa es de quien tomo la deuda».
Otra asunto que no está nada claro es, justamente, en cuanto beneficia a Patricia Bullrich el apoyo de Mauricio Macri. Ella misma parece considerar que es mejor despegarse para tener mayor oportunidad de captar cierto voto que oscila entre ella y Javier Milei, quienes consideran a Macri un representante de la «Casta».
En todos los escenarios vemos a Juan Grabois por arriba de lo que estima la mayoría de las consultoras, casi siempre por arriba de un 10% e incluso ganándole a Sergio Massa en algunos escenarios especificos. Es posible que nuestros datos estén sobreestimando las poblaciones de centros urbanos, aunque intentamos mitigar estos efectos, en ciertos escenarios complejos provocan una perdida de resolución suficientemente alta como para fallar en los resultados. De todos modos, para nosotros, esto es solo una elección de calibración.
Les recordamos que todos estos datos no son datos recabados a partir de encuestas recientes por lo que no incumple la veda la difusión del mismo. Simplemente son predicciones de modelos AI generativos completamente ficcionales, que pueden o no acertar.
Lo sabremos en 6 días.