En la primera parte de esta serie analizamos el lenguaje que algunos de los políticos mexicanos usan en Twitter a nivel de palabras, es decir, únicamente enlistamos la frecuencia en que algunas palabras aparecen en los tweets de estos personajes. Este análisis nos permitió darnos una idea general de los intereses y estilos de cada uno de ellos, sin embargo, al usar palabra por palabra para nuestro análisis prescindimos del contexto en que éstas fueron utilizadas. En esta segunda parte intentaremos ir más a detalle para descubrir los temas que cada uno trata en Twitter.
En este artículo trataremos de descubrir el contenido semántico en los tweets, es decir, su sentido o significado, lo que nos permitirá caracterizar el discurso (en Twitter) de cada uno de los políticos y dar una medida de similitud entre sus discursos.
Con dicho objetivo en miras, usamos un modelo probabilístico bien conocido en el ámbito del procesamiento del lenguaje natural (humano) llamado «alocación de Dirichlet latente» o LDA por sus siglas en inglés. La idea detrás de este modelo es que un conjunto de palabras que se repite en varios textos representa un tópico y un texto está dado por un conjunto de tópicos. En el caso de Twitter, por tratarse de mensajes cortos, de hasta 140 caracteres, asumiremos que cada tweet está compuesto únicamente por un único tópico. Es así que, por ejemplo, palabras como «epn», «casa» y «blanca» –que por separado no nos dicen mucho– al aparecer repetidamente en varios tweets nos indican la posible existencia de un tópico.
Para esta publicación se buscaron 140 tópicos en 35,373 tweets, conformados por 11,856 palabras distintas y
publicados por 30 usuarios a partir del 1º de julio del 2014 hasta el 9 de mayo del 2016. Cabe destacar que los tweets que aquí se tomaron en cuenta no incluyen retweets ni replies. De los 30 usuarios analizados 8 pertenecen al PRI, 7 al PAN, 4 al PRD, 4 a MORENA, 3 son independientes y 1 al PVEM, PT, Nueva Alianza y Movimiento Ciudadano.
Los temas que los políticos hablan en Twitter
Como un tópico es un conjunto de palabras que aparece frecuentemente en varios tweets, utilizamos las 10 palabras más frecuentes dentro de un tópico para caracterizarlo. Es así que, dentro de los 140 tópicos aquí analizados, los 10 más relevantes o, dicho en otras palabras, los que más se han hablado son
tópico_1={gobernador, candidato, felicidades, éxito, gran, campaña, gobierno, @prdmexico, mejor, ganar},
tópico_2={mujeres, país, igualdad, mejor, vida, hombres, política, derechos, futuro, seguir},
tópico_3={relación, cooperación, #méxicoglobal, países, visita, diálogo, @epn, fortalecer, relaciones, lazos},
tópico_4={inversión, #puebla, pesos, millones, mdp, centro, productores, inaugurando, entregamos, inauguramos},
tópico_5={invito, entrevista, platico, @radio_formula, 104, @mileniotv, @noticiasmvs, programa, #alaire, escucharnos},
tópico_6={presidente, @epn, nacional, visita, pdte, ceremonia, bienvenida, #méxicoglobal, honor, acompañé},
tópico_7={felicidades, reconocimiento, labor, trabajo, muchas, gran, mujeres, mexicanos, entrega, compromiso},
tópico_8={cumpleaños, abrazo, fuerte, mando, felicidades, muchas, envío, motivo, felicitación, amigo},
tópico_9={reunión, trabajo, américa, reuní, marco, exteriores, #méxicoglobal, foro, presidente, relaciones},
tópico_10={niños, programa, cdmx, niñas, atención, educación, salud, entregamos, seguridad, #cdmx}.
Si bien, los anteriores son los temas que más se han hablado, cabe destacar que juntos no alcanzan el 16% de los tweets analizados, lo cual se debe a la variedad de temas que estos usuarios tratan en esta red. Los demás tópicos pueden verse en la Figura 1 donde el lector podrá encontrar más temas interesantes.
Similitud del discurso de los políticos
Hasta ahora hemos visto lo que han dicho, en su conjunto, nuestros 30 políticos en Twitter, pero más importante para nuestro análisis es saber quién dijo qué. Para este propósito tomamos el promedio de la distribución de tópicos por personaje –lo que sería algo así como su tweet promedio–, de manera que ahora podemos relacionar a cada usuario con cada tópico y conocer la frecuencia con que éste último aparece en sus tweets. La Figura 2 es una visualización de esta relación (haz click sobre ella para verla completa).
Figura 2. Matriz usuario-tópico. Cada celda relaciona un tópico con un usuario, entre más obscura el tópico aparece con mayor frecuencia en los tweets. Haz click en la imagen para ver visualización interactiva completa.
Con el tweet promedio por usuario es posible dar una medida de distancia entre los temas que nuestros políticos hablan en Twitter. En la Figura 3 representamos la distancia del discurso de los políticos en Twitter como la cercanía entre los puntos, subrayando que los ejes carecen de significado.
Figura 3. Similitud de los discursos de los políticos en twitter. Cada punto representa el tópico promedio de un usuario y la distancia entre ellos es una aproximación a su similitud.
En la Figura 3 podemos ver que la parte superior izquierda de la gráfica es dominada por gobernadores como Manuel Velasco (PVEM), Rafael Moreno Valle (PAN), Miguel A. Mancera (independiente) y Jaime Rodríguez (independiente) –quizá la jefa delegacional Xóchitl Gálvez (PAN) también– lo que nos sugiere que los temas que gobernantes tratan en Twitter son similares. En este grupo encontramos temas como
tópico_10={niños, programa, cdmx, niñas, atención, educación, salud, entregamos, seguridad, #cdmx},
tópico_13={#puebla, san, inauguramos, habitantes, centro, salud, inversión, agua, ampliación, rehabilitación},
tópico_51={#periscope, #chiapas, directo, sesión, nacional, gabinete, reunión, #mhestucasa, delegacional, presidente},
tópico_56={#chiapas, entregamos, apoyo, alumnos, familiar, economía, primaria, educación, escolares, 000},
tópico_78={cdmx, nacional, país, nivel, #puebla, #chiapas, mundial, educación, internacional, lugar};
pero también encontramos temas como
tópico_6={presidente, @epn, nacional, visita, pdte, ceremonia, bienvenida, #méxicoglobal, honor, acompañé},
tópico_32={reunión, trabajo, secretario, general, agradezco, comparto, director, comisión, titular, subsecretario},
tópico_84={convenio, #periscope, directo, colaboración, firma, firmamos, acuerdo, internacional, @sre_mx, #puebla};
que explican la presencia en este primer grupo del secretario de Desarrollo Social José Antonio Meade (PRI) y a la Secretaria de Relaciones Exteriores Claudia Ruíz Massieu (PRI) –antes Secretaria de Turismo. La ausencia de Enrique Peña Nieto en este grupo –el grupo de los gobernantes– se debe a que él también trata otro tipo de temas como
tópico_47={cambio, climático, desarrollo, global, compromiso, medio, #méxicoglobal, ambiente, acuerdo, #cambioclimático},
tópico_109={@pcsegob, población, indicaciones, huracán, autoridades, colima, vecinos, atención, #mhestucasa, #miércolesciudadano};
y temas que lo acercan más al grupo al centro-abajo de la gráfica.
La parte inferior de la gráfica está dominada, sobre todo, por legisladores y presidentes o figuras de los partidos políticos. Entre los legisladores se encuentran Emilio Gamboa (PRI), Ivonne Ortega (PRI), César Camacho (PRI), Miguel Barbosa (PRD), Dolores Padierna (PRD) y Roberto Gil Zuarth (PAN); entre los presidentes de partido a Manlio F. Beltrones (PRI), Ricardo Anaya (PAN), Dante Delgado (MC) y el expreseidente del PRD Carlos Navarrete. Algunos temas tratados en este grupo son
tópico_1={gobernador, candidato, felicidades, éxito, gran, campaña, gobierno, @prdmexico, mejor, ganar},
tópico_2={mujeres, país, igualdad, mejor, vida, hombres, política, derechos, futuro, seguir},
tópico_20={sistema, nuevo, justicia, penal, gobierno, reforma, seguridad, transparencia, corrupción, pública},
tópico_21={ley, reforma, general, @senadomexicano, materia, dictamen, aprobamos, leyes, nacional, aprobación}.
Sobre este segundo grupo es interesante observar que los políticos del PRI aparecen en el extremo izquierdo, lo que puede interpretarse, en general, como el discurso de un priista se parece más al de otro priista que al de miembros de otros partidos. ¿Será que esto se debe a diferencias ideológicas o a un fenómeno gobierno-oposición?
Por último, en la parte superior derecha de la gráfica encontramos a personajes como Andrés Manuel López Obrador (MORENA), Martí Batres (MORENA), Gerardo Fernández Noroña (MORENA), Agustín Basave (PRD) y Jorge Castañeda (independiente); un poco más alejada aparece Layda Sansores (MORENA). El hecho de todos los políticos de MORENA aquí analizados aparecen en este extremo de la gráfica nos permite hacer también la interpretación de el discurso de un miembro de MORENA se parece más al de otro miembro de MORENA que al de miembros de otros partidos. Sin embargo, esta vez la distancia a los políticos de otros partidos es mayor. Algunos de los tópicos que encontramos dentro de este grupo son
tópico_38={epn, corrupción, calderón, dice, carlos, gobierno, salinas, @epn, milenio, peña},
tópico_12={prd, pri, pan, morena, #morena, gobierno, voto, electoral, madero, candidato},
tópico_96={epn, casa, #periscope, avión, blanca, directo, millones, petróleo, consulta, licitación}.
Conclusión
A manera de conclusión, podemos pensar que en el discurso de los políticos en Twitter es un reflejo de la realidad política del país. Sin embargo, su análisis, por tratarse de lenguaje natural, es complicado y cualquier intento debe ser tomado como una aproximación, que no la realidad en sí misma. En este artículo únicamente describimos resultados generales sobre la similitud de los discursos, pero cabe destacar que los mismos resultados pueden usarse para responder a preguntas más específicas, como ¿quiénes hablan más de temas relacionados con transparencia (tópicos 20 y 52)? o ¿quiénes hablan más de Ayotzinapa (tópico 89)? Para verlo puedes hacer uso de esta visualización.
Notas
- Figura 1 basada en en la visualización LDAvis de Carson Sievert y Kenneth E. Shirley
- Imagen de Politica-Twitter tomada de http://tellado.es/eres-lo-que-tuiteas-guia-de-uso-de-twitter-para-politicos/