Inferencia causal en series de tiempo de Twitter y encuestas políticas

  • Federico Albanese
  • Juan Manuel Baldonado
  • Esteban Feuerstein

Resumen

Las redes sociales han sido utilizadas como medios para la discusión política de los ciudadanos [1]. En este trabajo nos propusimos analizar la influencia que ejerce el discurso en las redes sociales sobre la opinión pública de los candidatos políticos en contextos electorales. Para ello conformamos un dataset con 4.4 millones de tweets políticos durante las elecciones presidenciales estadounidenses entre Trump y Biden del 2020 y analizamos 229 encuestas presidenciales realizadas por 29 encuestadores. Luego, armamos series temporales con los resultados de las encuestas y con la cantidad, tópico del que hablan y sentimiento (positividad / negatividad) de los tweets que mencionan a cada candidato, usando técnicas de procesamiento del lenguaje natural de forma similar a trabajos previos [2]. Aplicando herramientas de inferencia causal en series de tiempo [3] [4] como la causalidad de Granger [5], Información Mutua Condicional [6] y Base de Funciones Radiales [7], encontramos resultados estadísticamente significativos de una relación causal. En particular, el sentimiento con el que se habla de los candidato y ciertos tópicos particulares que se debaten en Twitter impactan sobre la intención de voto que finalmente recibe cada candidato presidencial.

Publicado
2022-12-14
Cómo citar
Albanese, F., Baldonado, J. M., & Feuerstein, E. (2022). Inferencia causal en series de tiempo de Twitter y encuestas políticas. Memorias De Las JAIIO, 8(1), 25-27. Recuperado a partir de https://ojs.sadio.org.ar/index.php/JAIIO/article/view/246
Sección
AGRANDA - Simposio Argentino de Ciencia de Datos y GRANdes DAtos