Métodos etnográficos en línea, comunidades virtuales y análisis de sentimientos.
Por: Luis Felipe Navarrete Echeverría
La conformación de ecosistemas mediáticos consolidados por la edificación de las infraestructuras y tecnologías digitales de la información y la comunicación, ha permitido la expansión, asentamiento y dinámicas particulares de comunidades en el ciberespacio. Este fenómeno ha fomentado la apertura de dimensiones de investigación; una de ellas es la aplicación de métodos etnográficos en línea, potente enfoque metodológico que permite generar elementos para la comprensión de las comunidades virtuales.
Esta ruta de trabajo investigativo sitúa la mirada sobre las particularidades de estos agentes, sus procesos, así como el trabajo sobre documento on-line así como la posibilidad de generar interacciones con estas comunidades. Desde lo señalado por Jörgen Rahm-Sâgeby, puede verse cómo desde allí se puede hacer seguimiento de las participaciones de los usuarios, las dinámicas y protocolos de intercambio de información y comunicación; procesos claves de este tipo de comunidades, estableciéndose cierta facilidad de registro, en tanto las actividades que ocurren en estos espacios, quedan registradas en estos soportes y permiten la recolección de datos; pueden registrarse “huellas” y actividades concretas y datos perdurables.
Debe señalarse que la etnografía o aplicación de métodos de esta orientación en comunidades en línea, tiende a centrarse en un enfoque cualitativo, puede potenciarse desde el uso de métodos computacionales (teniendo en cuenta la amplia cantidad de datos y las posibilidades brindadas por estas herramientas), que se adentran en las dinámicas de redes sociales digitales, permiten el rastreo de las formas de-ser en comunidad, su organización, caracterizar comportamientos y prácticas mediáticas. Puede resultar sumamente provechoso, enfocar esta perspectiva metodológica al seguimiento o la articulación del mundo on-line al of-line o lo que se referencia como “etnografía Interconectada” que permite (permitiría) mapear varios lugares, términos de uso y prácticas de interacción.
La propuesta de Sâgeby se concentra en la explicación de la realización de este tipo de etnografía, mostrando algunas de las similitudes con la etnografía tradicional, así como las formas de rastreo o recopilación. En términos estructurales, se señalan los siguientes momentos cómo claves en la elaboración y desarrollo:
- Podemos hablar de la definición de entorno, del fenómeno, de la configuración y el enfoque. Aquí se sitúa la perspectiva de investigación, la historia (o historicidad como fenómeno continuo, inacabado, inclusive podemos agregar: hipertextual, reticular, interconectado), las características del entorno, los usuarios, contenidos…en una acción que se orienta a delimitar y describir. Las siguientes preguntas pueden dar orientaciones que ayudan a la precisión en este posicionamiento:
A su vez, debe precisar la modalidad de acción que tendrá el investigador: puede participar como espía (de manera incógnita, registrando, no interviniendo las prácticas y trabajado sobre perfiles o entornos públicos o abiertos); como miembro (por modos de relacionalidad de interés, por pertenencia al grupo, por agregación…) o declarando su posición como investigador de lo que allí ocurre. Esto hace necesario recurrir a elementos de habeas data y la consolidación inicial de una –no formal- declaración del lugar de enunciación-investigación, acompañando a su vez las implicaciones éticas del estudio.
- Seguiríamos con la recopilación de datos en línea, que se nutriría de la riqueza multimedial –en términos de lenguajes-formatos- que precisa el manejo o registro de imágenes, sonidos, la pregunta por ¿qué datos son significativos? ¿qué datos permiten precisar la comprensión? Se puede señalar una fuerte orientación hacia los datos de textuales. Aquí también se despliegan las materializaciones de forma de tomar los registros: procesos de inmersión, diarios de campo…
- Una vez realizada esta gestión, se continúa con el debido análisis de datos. si bien se puede apelar a diversas herramientas computacionales que permitan “la mirada del investigador”, se puntualizan procesos concretos como la mirada a las recurrencias, las concurrencias, que están acompañadas u orientadas por procesos de codificación e inclusive por los soportes que se tienen concernientes a categorías o enfoques teóricos.
Puede hablarse de una inter-etapa o etapa contingente que se situaría en la (retro) alimentación de información a la comunidad estudiada, concentrada en la adición de datos, la revisión de problemáticas, las –hipotéticas o parciales- soluciones a problemáticas…aspectos que dependen del grado de implicación del investigador, así como de la problemáticas desde la cual se edifica la investigación.
- Presentación de datos. Luego de las etapas anteriores, se precisa de la presentación de los resultados, que busca articular las cualidades del diseño digital con las proyecciones alcanzadas a –casi- manera de conclusiones, que se enfoca en la comprensión del fenómeno estudiado en estos entornos. Se busca la prevalencia de la perspectiva analítico-descriptiva.
No puede omitirse el hecho de que este tipo de investigaciones, al trabajar con agentes humanos, insertarse en relación a emociones, sentimientos, ideologías, rituales, prácticas de sentido… debe posicionarse en el ámbito de una ética de la investigación, que se sostiene desde la claridad, el manejo adecuado de la información, la transparencia con los resultados, las consecuencias de los resultados…una serie de acuerdos que deben inclusive entrar en negociación con las comunidades investigadas y ampararse inclusive en criterios normativos en aras de la transparencia o reconocimiento de principios.
El autor va a considerar algunas de las limitaciones y potenciales del enfoque etnográfico aplicado a comunidades en línea. Dentro de las primeras, se va a señalar: su representatividad: la volatilidad, fragmentación y pasos del online al off line, así como los sentidos de enlace o interacción, no van a permitir realizar grandes generalizaciones –inclusive la etnografía tradicionales reconoce y asume esta “imposibilidad”; a su vez el anonimato y las orientaciones tiene su implicación al momento de hablar de fiabilidad, pues se pueden realizar ajustes o “procesos de edición” sobre lo allí establecido. Otro elemento que interfiere en aquí es la existencia de bots, esas “máquinas de-lo falso” que inciden en los datos que se generan en estas comunidades. Ahora bien, respecto a la potencialidad de esta metodología esta la rigurosidad del rastreo, el trabajo interactivo con las comunidades, que puede abrir amplios márgenes para la comprensión del fenómeno, lo cual enriquece el valor heurístico de este tipo de investigaciones.
Una de las miradas concretas sobre enfoques o posibilidades de investigación en los Ciber-entornos está concretado en los “análisis de sentimientos” como el trabajo que presentan Pudarruth, Moheeputh, Permessur y Chaamroo, en el cual, utilizando la herramienta N’vivo 11 y la posibilidad de codificación automática, se centraron en un análisis de este tipo realizado a partir de los comentarios en Facebook.
En este trabajo se reconoce el poder exponencial de las redes sociales digitales y cómo el incremento en la cantidad de usuarios (por ejemplo en Facebook) y la gran cantidad de información que allí se comparte (que va desde información personal, religión, edad, status, estilo de vida, preferencias, ideología, valores, sentimientos). Los investigadores se centraron en el análisis de este tipo de data, que pasó de un registro inicial de comentarios, para luego hacer una categorización ente comentarios positivos, negativos y neutros a través de la función automática de N’vivo.
Los investigadores, antes de ahondar el desarrollo de su proceso, presentan un pequeño “estado del arte” en el cual se puede resaltar:
- Deben reconocerse las posibilidades de revisar conversaciones públicas en los muros, así como el reconocimiento de las configuraciones de privacidad, lo cual `puede concluir en una facilidad de registro o marcar limitaciones a accesos restringidos.
- En redes sociales digitales como Facebook, los usuarios están expresando las particularidades de su vida cotidiana, sus experiencias, sus amistades; acciones materializadas a través de mensajes, likes, publicaciones, comentarios, imágenes, tags…este tipo de contenidos permite acercarse a una caracterización de sentimientos que dan cuenta de los impactos en el pensamiento y el comportamiento. Palabras (o reacciones) se expresan en categorías como “feliz, triste, enojado, amor, odio…”
- Realizar análisis de sentimientos permite, a través de los comentarios y publicaciones, hacer caracterizaciones precisas sobre las actitudes de los usuarios frente a determinadas referencias. Esto se ha aprovechado por empresas que buscan hacer posicionamiento de mercancías, rastrear la percepción frente a nuevos productos, determinar la lealtad a la marca o el impacto de la reputación o la imagen. Lo fundamental es la codificación que permita precisar la tendencia de los sentimientos. Se han usado para esto algunos tipos de clasificadores como “Support Vector Machines (SVM) o Naïve Bayes”.
- El análisis de sentimiento ha resultado enriquecedor para revisar en términos generales el comportamiento humano frente a ciertas experiencias.
- La bibliografía e investigaciones sobre análisis de sentimientos ha venido en aumentos, tal como lo detectó el trabajo realizado por Sharef, midiendo el número de publicaciones –reg. Scopus- y señalando el incremento de trabajos en redes sociales como MySpace, Flicker, Twitter y Facebook.
- El trabajo de Ortigosa et al. Apeló a un enfoque hibrido que involucró léxicos y técnicas de aprendizaje automático, con el objetivo de extraer sentimiento de los mensajes y estados de Facebook, desde allí se ha buscado precisar la “personalidad” y precisión de los datos. en su aplicación y revisión sobre posibilidades de predicción fundamentada en los sentimientos, se señala que se puedo predecir la personalidad de unos 20000 usuarios, marcando una precisión del 62% desde la aplicación de su modelo de clasificación.
- El rastreo de interacciones y los niveles de sentimientos en las interacciones en facebook fue aordado por Terrana, marcando los temas, los perfiles con quien más se discute, los niveles de acuerdo y desacuerdo. Para esto se registró un análisis de sentimientos sobre 187 políticos después de las elecciones. A su vez Caton, entre otros, se centraron en el análisis de 1.9 millones de comentarios politicos para ver la percepción frente al pasado, presente y futuro. Una experiencia situada en MySpace, concluyó que los usuarios mujeres tienden a recibir y dar más comentarios positivos que usuarios hombres.
- Este tipo de análisis, situado en Twitter ha mostrado: Bae y Lee revisaron el efecto de las personas influyentes en sus seguidores, para comprender el impacto emocional en las audiencias; el trabajo de Pearce sobre los comentarios sobre el cambio climático precisa que las personas tienden a responder a personas que tienen las mismas inclinaciones de opinión, a su vez se ha estudiado la acogida de productos concretos especificando como la acogida emocional incide sobre el fracaso o éxito de los mismos…desde allí se han buscado fortalecer tecnologías para el rastreo y registro.
- El grupo de Losub investigó la colaboración en Wikipedia y encontró que las emociones esta articuladas con características como status y género.
- Se han estudiado las percepciones de los turistas en la fuente de TripAdvisor, revisando la incidencia de las opiniones sobre las decisiones.
- Autores como Gopladas hablan de la imprecisión, inexactitud y limitaciones que se dan en las conclusiones en este tipo de análisis.
Ya situados en el trabajo de Pudarruth et al. Se concreta un análisis sobre las emociones detectadas en publicaciones y comentarios de una pag. De Facebook (Opiniones opuestas 2016), utilizando el software Nvivo 11 para el manejo de datos no estructurados, así como el complemento Ncapture. Para la clasificación (positivo-negativo-neutro) se realizó inicialmente un proceso de limpieza de datos –pues aparecen muchos metadatos- . Se revisaron las cadenas, para pasar a su revisión individual en un proceso de división (tokenización), pasando luego a la revisión de las derivaciones, dadas las múltiples formas o raíces de las palabras en inglés que aparecían en la muestra y podían facilitar la precisión (ejemplo: analizar, análisis, analiza…
Seguido a esto, se aprovechó el uso de Nvivo para el manejo de sinónimos o palabras similares (miedo: temor, pavor, asombro…). Esto se proyectaba al paso de la clasificación, para lo cual se continuó con el codificador automático de la aplicación usada, pasando inclusive a regulaciones como: positivo, muy positivo, negativo, moderadamente negativo; proceso que requería la revisión de los modificadores –adverbios-.
Los investigadores encontraron que de una totalidad de 626: 215 se han codificado como muy negativos, 173 como moderadamente negativos, 110 como moderadamente positivos y 75 como muy positivos. Los comentarios que no están codificados en estas cuatro categorías se consideran neutrales.
Nvivo se sitúa para esta clasificación en el análisis de palabras aisladas y permite una mirada panorámica y rápida sobre los datos, en tanto facilita la carga de data, el procedimiento sobre el codificador y los procesos de graficación. Esto permitió al equipo trabajar sobre datos textuales y señalar que se puede revisar el uso de expresiones en redes sociales para establecer precepciones; acción recomendada a empresas para escuchar los modos de apropiación del mercado desde los usuarios, diseñar estrategias, evaluar opiniones y mejorar la oferta de manera o desde referencias concretas.
Los investigadores señala además que la herramienta N’vivo 11, si bien es potente, no permite tomar el análisis de todo el comentario –pues se hace palabra por palabra- , además, como otra de sus limitaciones, está en que no tiene en cuenta el contexto, no reconoce jergas, regionalismos, modismos, neologismos ni sarcasmos. Esta investigación reconoce, no trabajo con las imágenes y otros elementos que aparecían allí (como enlaces), componentes que permitirían mejores niveles de especificidad.