Mapping information and identifying disinformation based on digital humanities methods: From accuracy to plasticity. Julien Longui. Université Cergy Pontoise, Francia. 2021
Víctor Hugo Ábrego
En este texto, Julien Longui desarrolla una propuesta de cómo desde el paradigma de las humanidades digitales es posible ampliar y fortalecer teórica y metodológicamente el análisis del discurso político.
El profesor Longui trabaja en la Universidad Cergy, en Francia, donde desarrolla investigaciones acerca de diversos temas sociales desde la perspectiva de corpus textuales, utilizando análisis de datos, específicamente de texto, a gran escala.
El texto en cuestión, publicado en 2021, inicia con una contextualización que pone en evidencia el momento de intersección actual entre el diálogo de ciencias sociales y humanidades, la ampliación de herramientas digitales de análisis y visualización de grandes volúmenes de datos, y el acceso a fuentes de conocimiento disponibles para ser analizadas con estas herramientas. Para Longui, el paradigma emergente a las humanidades digitales es un paradigma en donde esta cooperación interdisciplinar puede tener lugar.
Anclado a los estudios críticos del discurso, el autor se pregunta cómo es que el análisis del discurso y de la semántica discursiva pueden ser integrados en el paradigma de las humanidades digitales. Su propuesta parte del análisis de corpora, es decir, de datos existentes y previamente ubicados en un espacio sociodiscursivo.
En tanto inserto en la amplia discusión acerca de los recortes y bordes del corpus, y sus implicaciones teóricas y políticas, que ha de ser utilizado como objeto de análisis discursivo, el texto propone un modelo de cuatro niveles de contexto que contemplan aspectos “internos” y aspectos “externos” de una muestra analizada. Se trata de:
- el texto que acompaña cada totalidad de la muestra
- el con-texto en el macro-texto de la muestra
- el contexto sociopolítico del evento discursivo
- las relaciones inter-discursivas e intertextuales de evento discursivo correspondientes, relacionadas con otros eventos relevantes.
De este modo, podemos decir siguiendo a Aguilar et al. (2014), Longui parte de las posibilidades de analizar el discurso a partir de todos los elementos que lo componen en tanto formulación, como de aquellos otros aspectos que lo constituyen de manera externa, en tanto formación.
El primer caso que utiliza Longui para hacer operativa su propuesta conceptual y algunas herramientas de análisis de texto, es el uso del discurso por parte de Donald Trump durante el 2018. Trump, nos dice el autor, “ha convertido las palabras en armas. Y está ganando la guerra lingüística”. La conversión de las palabras en armas y la utilización de ciertos términos de manera imprecisa, le permiten a Longui afirmar que “necesitamos considerar no la precisión de los hechos siendo transmitidos (por las palabras en el discurso) sino el modo en que “la realidad” se convierte en discurso mostrado y percibido”. Es decir, el discurso siempre puesto en relación con aspectos contextuales relacionados con el propio evento discursivo y con el contexto político en el que está inserto.
Las noticias falsas en la propuesta de Longui son entendidas como un elemento discursivo, éstas han de ser “tomadas a la luz de discursos que las producen y aquellos que las toman, las comentan o las refutan, colocándolas en lo discursivo, en lo interdiscursivo y en lo hiper-discursivo”. Es decir, para Longui, las fake news no son postales estáticas del discurso sino rutas de sentido que se van construyendo en los escenarios y soportes que las utilizan, tanto para reafirmarlas como para cuestionarlas, pero que en todo caso las siguen integrando en algún circuito de producción social de sentido. Siguiendo esta idea, y de la mano de Sarfati, Longui afirma que las noticias, reales o falsas, han de ser consideradas como “instituciones de sentido”, es decir, como “dispositivos socio-discursivos cuyo propósito es producir y perpetuar normas de pensamiento, expresión y acción entre los actores que forman parte del discurso”.
La utilización de herramientas de visualización de datos, como Iramuteq y Gephi, le permiten al autor dar cuenta de ejemplos de cómo elementos contextuales del uso discursivo de actores específicos, por ejemplo del Frente Nacional en Francia, permiten identificar desviaciones u orientaciones semánticas forzadas en contra de grupos sociales, como la comunidad musulmana en Francia. El autor identifica “plantillas” utilizadas por este partido político en su discurso público, que construyen una suerte de repertorio de sentidos negativos acerca del islam, que se evidencia mediante sufijos, prefijos y adjetivos alrededor de raíces semánticas y palabras clave asociadas con esta comunidad. Este tipo de utilización de herramientas es una muestra de las posibilidades de unir los puntos de intersección con los que abre el texto. Así, el diálogo entre perspectivas de análisis crítico del discurso, de la mano de herramientas de manejo y visualización de datos y de la disponibilidad de corpora relacionadas con temas sociales relevantes, puede acercarnos a la construcción de preguntas para entender formas discursivas acerca de temas urgentes como las noticias falsas y las formas de legitimar socialmente pensamientos xenófobos y racistas.
El texto alimenta la discusión e incentiva la experimentación en los métodos de análisis de bases de datos no estructuradas y de texto en general. Las medidas ofrecidas por gephi o iramuteq a la hora de calcular y mostrar comunidades en grupos textuales específicos, bien pueden ser utilizados, y ya lo están siendo, para comprender y hacer experimentos con herramientas que generen módulos a partir de embeddings y clusters de textos con Inteligencia Artificial.
Finalmente, un punto ciego en la lectura de las humanidades digitales de Longui, es que si bien en Europa y en el mundo angloparlante, este campo viene de la literatura y de la lingüística, en países fuera del norte global, por ejemplo México o Colombia, el campo parece estar emergiendo y consolidándose de hibridaciones que vienen de áreas como el diseño y la comunicación, o la archivística y la historia. En todo caso, algo que ha definido a las humanidades digitales es justo su falta de definición en tanto que precisamente la convergencia de la hibridación que las constituye no viene de los mismos campos en todos los países o regiones. Caso distinto está ocurriendo en el campo de los Estudios Críticos de Datos, en el cual, si bien persiste la misma suma interdisciplinar para ser construido, parece que el diálogo, hasta ahora más orientado en preguntas que problematizan epistemológica, teórica y políticamente a los datos y a los procesos de datificación (cómo se producen los datos, en qué contexto se genera la captura, cuáles son los sesgos que se reafirman en una muestra de datos, de quiénes son los intereses alrededor del manejo de datos, cuál es el tipo de relación asimétrica con los sujetos que establece el manejo de los datos), da una impresión de acuerdo en cuanto a los puntos de partida del campo.