Síntesis de Datos a Emplear en Miniproyecto Modulo 2 Estadística – Henry Romero

La base de datos que se ha elegido es la de las empresas de interés público cuya forma jurídica en Colombia son las sociedades anónimas sin embargo se excluyen las del sector financiero. Son empresas que están activas en el mercado y con datos disponibles para los años de 2010 y hasta 2018. En la ficha siguiente se detalla la estrategia de búsqueda en la plataforma ORBIS. Del total obtenido se filtran las 50 principales, dado que el total son 58, para emplear un numero cerrado sin que esto afecte la significatividad de la muestra pues es casi el total de la población.

Las variables que se consideran son financieras y se detallan a continuación:

Nombre empresa

Ingresos de explotación (turnover)

Fondos de los accionistas

Capital

Otros accionistas de fondos

Pasivos no corrientes

Deuda a largo plazo

Otros pasivos no corrientes

Provisiones

Deudas a corto plazo

Préstamos

Acreedores

Otros pasivos circulantes

Total pasivo

Activos

De estas variables es posible relacionar el nivel de ingresos de explotación con los pasivos, los activos, con el capital o con los fondos de los inversionistas.

Una manera de disponer las variables es considerar la variable ingresos como dependiente y las demás como independientes la razón de ello es que el conocimiento empírico indica que el nivel de ingresos de una empresa depende de muchas variables internas y externas. En este caso son internas y se expresan en los recursos empleados por las empresas para generar sus ingresos, los cuales son los activos que se reflejan como la sumatoria del capital, los pasivos y los fondos de los inversionistas.

Preguntas e hipótesis

Las preguntas que estadísticamente podemos hacer a estos datos son:

  1. ¿De qué manera están relacionados los ingresos con los niveles de recursos de las empresas?
  2. ¿Qué relación hay entre las obligaciones de las empresas y el rendimiento del capital?
  3. ¿Cómo se ven reflejadas variables del sistema en los niveles de ingresos?

Hipótesis en cada caso:

  1. La relación es directa y positiva
  2. No hay una relación regular
  3. Los efectos de las variables externas afectan positiva o negativamente los ingresos de manera directa.

Módulo 2. Estadística inferencial (con énfasis en análisis de regresiones)

[Contenido semanas 6, 7, 8,9]

Semana 6 (24.2.2020)

Conceptos básicos de estadística. Tipos de variables, tipos de distribuciones. Preguntas que pueden ser resueltas a través del análisis de datos cuantitativos, producción, búsqueda y gestión de datos cuantitativos.

Lecturas requeridas:

  • Allen, M.,  (2011). “Quantitative Research in Communication”, Cap 1-2 En: https://bit.ly/2wWsswO

Lecturas adicionales:

  • Hayes, A.F. (2005). Statistical methods for communication science. Cap 1-3 En: https://bit.ly/2PAGbQz

Laboratorio:

  • En esta primera sesión, intentaremos construir una tabla de observaciones con distintos atributos que podemos tomar como variables de los distintos tipos vistos.  La idea es poder definir un conjunto de datos relacionados con nuestra pregunta de investigación que nos sirva para hacer estadística descriptiva, análisis multivariados y correlaciones.

Semana 7 (2.3.2020) 

Definiendo el miniproyecto: Para esta clase les pido que organicen una matriz de datos en un libro de Excel que les sea útil para el desarrollo de las clases. En esta, les pido que incluyan una serie de observaciones (empresas, tweets, inversiones,  contenidos en periódicos, u otros) en donde tengan una variable que podamos definir como dependiente, y otra serie de variables que podamos pensar como independientes.  Además de la matriz, el libro debe contener en otra hoja de Excel un diccionario de datos, es decir, el listado de variables de la matriz, con una definición de acuerdo a su tipo (dependiente o independiente), la forma que toman los valores de la variable (discreta o continua) y la escala de medición (nominal, ordinal, intervalo de razón)

En nuestro espacio de trabajo común (metodos.work) les pido que para la próxima sesión hagan una pequeña síntesis del conjunto de datos que usarán en las siguientes dos sesiones.

Semana 8 (9.3.2020) 

Análisis de datos bivariados y multivariados. Testeo de hipótesis y tipos de relaciones entre variables 

Lecturas requeridas:

  • O’Dwyer, L. M. & Bernauer, J. A. (2014). Inferential analyses for data generated by quantitative research. In Quantitative research for the qualitative researcher(pp. 228-262). Thousand Oaks, CA: SAGE Publications, Inc. doi: 10.4135/9781506335674.n10 En: https://bit.ly/2TuNKt3

Lecturas adicionales:

  • Hayes, A.F. (2005). Statistical methods for communication science. Cap 1-3 En: https://bit.ly/2PAGbQz

Laboratorio:

  • Vamos a empezar a leer nuestros datos con R, hacer estadísticas descriptivas y visualización de datos.  Identificaremos hipótesis que podamos probar con los datos que estemos trabajando 

Semana 9 (16.3.2020)

  • Análisis de series de tiempo, análisis de correlaciones y análisis predictivo (regresión lineal) 

Lecturas requeridas:

  • Maria Mercedes: Jan van Dijk & Kenneth Hacker (2003) The Digital Divide as a Complex and Dynamic Phenomenon, The Information Society, 19:4, 315-326, DOI: 10.1080/01972240309487 https://bit.ly/2PVYCiX
  • Luis Felipe: Levin, N., Ali,S., Crandall, D., (2018),  Utilizing remote sensing and big data to quantify conflict intensity: The Arab Spring as a case study, Applied Geography, 94, 1-17. En: https://bit.ly/32KKwpF
  • Henry: González-García, L., Gómez-González, C., Clarice, C., Cubiles-de la Vega, M.D., Santos-Lozano, J. M., & Ortega-Calvo, M. (2014). Triangulación de un estudio cualitativo mediante regresión logística. Index de Enfermería23(1-2), 80-84. En: https://bit.ly/3albtmj
  • Amanda:  Orozco Hernández, M.E., Farfán Escalera, R., & Gutiérrez Sánchez, D.L. (2011). Desempeño ambiental de los recursos naturales en comunidades rurales, Estado de México. Investigaciones geográficas, (76), 84-103 En:https://bit.ly/32Hrpg2

Lecturas adicionales:

  • Adelheid, N. (2010). Displaying your findings a practical guide for creating figures, posters, and presentations. American Psychological Association.

Esta clase la iniciaremos con una presentación breve de cada una de las lecturas en donde nos enfocaremos en el tipo de pregunta y la técnica estadística empleada.  Culminaremos trabajando en el mini-proyecto que avanzamos en el transcurso del módulo

Evaluación módulo 2 (20%):

  • 5% Contribuciones en contenido a metodos.work
  • 5% presentación en clase de una de las lecturas
  • 10% actividades de laboratorio 

Atmósferas de opinión Elecciones Alcaldía de Bogotá 2019 – mini proyecto módulo 1

  1.  Introducción: Problema y pregunta de investigación. Delimitación temporal.

Los actores sociales han renovado las dinámicas propias en los procesos de producción y consumo de información, usos y prácticas que se reflejan en la manera en que éstos se (re) estructuran y dan sentido a la experiencia de lo social, aprovechando el potencial que los medios digitales les han provisto, abriendo formas alternativas y creativas de participación (Scolari, 2008. Jenkins, 2008) generando “importantes novedades en la comunicación política” (Marcos, Alonso y Casero, 2017, p. 25).

La apertura del campo de investigación, que articula la comunicación, la política, la opinión pública y las redes sociales ha catapultado conceptos al campo de análisis como “democracia electrónica”, “ciberculturas” (Levy, 2007), “ciberdemocracia”, “poder en red” (Castells, 2009), en un camino que se había edificado a partir de los estudios sobre el funcionamiento del sistema mediático dentro de la organización de lo social ,desplegándose hacia las evoluciones y dinámicas del nuevo ecosistema mediático.    Estas consideraciones han nutrido el desarrollo de trabajos que abordan de manera directa el papel de las redes sociales como orientadores de nuevos espacios de acción política, exigiendo, además, revisar los diseños de los modelos comunicativos que se dinamizan en estas formas de participación.

El estudio de la cultura política exige, tal como lo habían advertido Almond y Verba, la identificación de los centros de influencia y las élites (2001, p. 192-193) que pueden dinamizar o mediar las valoraciones, sentimientos y opiniones sobre los objetos políticos e inclusive, incidir directamente en los resultados de estos.    Estas dinámicas se han ubicado en las inter-mediaciones que se realizan desde tecnologías digitales de información y comunicación.

Internet y las redes sociales se concretan como espacios posibilitadores de participación y de evidencia de los efectos de estos procesos, situándose como un escenario “popular en el ámbito de la comunicación política” (Marcos, Alonso y Casero, 2017, p. 25).   La red twitter es un escenario donde convergen las manifestaciones de interés referidas a la política, “con más de 313 millones de usuarios activos en el mundo, se ha convertido en la red de diseminación de la información más importante del momento” (Gerbaudos, 2012. En: Marcos, Alonso y Casero, 2017, p. 26).

Investigaciones se han concentrado en el uso de twitter por parte de los partidos políticos en época electoral (Golbeck, Grimes y Rogers. Jackson y Lilleker.  En: Marcos, Alonso y Caseros, 2017.  López, 2012, p. 78), el uso que los políticos y periodistas dan a twitter para conocer el clima de opinión, twitter como escenario de crítica y descontento hacia la política, twitter como espacio de “discusión de asuntos políticos” (Marcos, Alonso y Casero, 2017, pp. 25- 28-29);

Se han estudiado así las estrategias con miras a la publicidad electoral (García, 2017), el uso de la comunicación política 2.0 como una alternativa comunicacional de los actores políticos al discurso de los medios masivos tradicionales, (Domínguez, 2012), así como la identificación de discursos políticos generados por líderes políticos y líderes de opinión (Sánchez, López y Barreto, 2013).

Se ha destacado el uso de soportes digitales como espacio de fluctuación entre la participación política y la opinión pública (Trillos, 2015), el potencial participativo que las redes sociales han generado, alentando a la ciudadanía a involucrase en lo referido a la política (Marcos, Alonso y Casero, 2017), las dinámicas propiciadas por la Política 2.0 en términos de un acercamiento de los actores políticos con las ciudadanías y las maneras en que éstos influyen en lo político; demarcando la incidencia de las redes sociales en esta esfera, destacando, como caso paradigmático, el triunfo de Barack Obama en Norteamérica (Sánchez, López y Barreto, 2013).  

En relación a los avances de las investigaciones y al interés por las dinámicas mediáticas que inciden –e incluso, determinan- en las estructuras políticas, mi proyecto se centra en la caracterización de las dinámicas de conformación de atmosferas de opinión generadas en twitter sobre las elecciones por la Alcaldía de Bogotá en 2019.  Esta meta, plantea la necesidad de identificar los nodos desde los cuales emerge y se dinamiza la información, la conformación de comunidades, fenómenos de polarización, transformaciones en el ecosistema mediático, asi como un interés por elementos de contenido.

  • Métodos y herramientas.

El desarrollo del proyecto se sustenta en las posibilidades expresadas por los métodos mixtos (Hernández Sampieri, R., Fernández Collado, C., Baptista Lucio, P. 2010) partiendo de una recolección y sistematización de datos, que permita proceder a una perspectiva descriptiva e interpretativa del objeto de estudio.

Se realizó trabajo con: Excel, Google Trends (mecanismo que permitió un rastreo paralelo del interés y las búsquedas sobre el proceso electoral y los candidatos por parte de usuarios de Google en relación a la popularidad de las búsquedas de categorías concretas), DataBasic (permitía clasificar contenidos) , TCAT (Herramienta que facilitó la consolidación de las bases de datos), Open Refine (limpieza y estructuración de data) Gephy (mecanismo para la visualización y modelización de redes) y N´vivo (Herramienta que permite trabajar sobre los contenidos)

  • Datos y Análisis

En el seguimiento del tema se revisaron las tendencias de búsqueda (usando Google Trends), tomando como referencia todo el año 2019. La figura 1 da cuenta de la búsqueda general sobre las elecciones por la alcaldía de Bogotá. Un tema central está relacionado con el papel de las encuestas de opinión (figura 2) y su incidencia al momento de proyectar al posible ganador (Figura 3), así como los momentos coyunturales que inciden en el proceso electoral, tema de búsqueda de los usuarios, que va a la par del interés por conocer los perfiles de los candidatos (Figura 4).  En las mediciones, se concentran los momentos de búsqueda entre el 13 de octubre y el 29 de octubre, mostrando el pico (en las cuatro figuras) el día de las elecciones.

Fig. 1. Fuente: Google Trends

Figura 2. Impacto de las encuestas en las elecciones alcaldía de Bogotá. Fuente: Google Trends

Figura 3. Ganador elecciones alcaldía de Bogotá según encuestas. Fuente: Google Trends

Figura 4. Búsqueda candidatos alcaldía de Bogotá según encuestas. Fuente: Google Trends

            Análisis Twitter

Para el cumplimiento del objetivo, se precisó hacer énfasis en la recopilación de datos establecida desde el 26 al 28 de octubre –antes, durante y día después de las elecciones).    El filtro se realizó con el uso de TCAT y se estableció una muestra de 376191 tweets (Figura 5).

Figura 5. Cantidad Tweets de la muestra.

Empieza a señalarse sobre la muestra, la intensificación en la producción y circulación de mensajes durante el día de las elecciones -27 de octubre-, evidente en las publicaciones, los tiempos de producción y circulación, las menciones y etiquetas generadas y la conformación de clústers (Figura 6).  Los clusters se ajustan a los líderes de opinión que se consolidan como nodos reguladores de la información (Figura 7), que se regulan a partir de etiquetas que se mueven rápidamente el día de las elecciones –determinado con el uso de TCAT- (tabla 1).

Figura 6. Caracterización dinámica de la muestra.

Figura 7. Clusters dinámicas tweets.

Hashtag Cantidad
@hollmanmorris 41618
@claudialopez 26402
@Bogotá 17149
@carlosgalan 14158
@metro 13779
@migueluribe 9894
@vamosavotar 23587
@gustavopetro 6795

Tabla 1. Etiquetas de mayor dinamismo el día de las elecciones

El dinamismo de estas etiquetas empieza a configurar dinámicas del ecosistema mediático, que se intensifican y concentran la centralidad de algunos nodos, mostrando constancia en los movimientos de los contenidos (figura 8. Tabla 2), intensificados el día de las elecciones.

Figura 8. Movimientos de los tweets en los días seleccionados.

Id Label no_tweets no_mentions modularity_class clustering
1 ncbogota 41 1298 2 0.239316
2 hollmanmorris 239 102482 0 0.063394
6 claudialopez 45 172343 1 0.035141
10 lapazcolombiani 76 301 1 0.281579
16 alexkleino 118 313 1 0.304167
18 plataskar 22 242 1 0.466667
19 partidofarc 4 382 5 0.035714
21 mileshmora2 56 2491 0 0.27197
22 petrogustavo 20 17090 0 0.109625
24 ivager69 242 1360 0 0.174467
26 erickmontes1997 32 431 1 0.267692
28 carlosfgalan 198 43453 2 0.056327
30 cnnee 0 1663 0 0.21345
34 lunadavid 23 514 5 0.251462
37 quinterocalle 2 4252 5 0.115854
38 jorgeivanospina 0 882 1 0.098901
39 bluradioco 217 2390 1 0.177748
41 perfilcom 19 128 10 0.2
47 indiracolonia 511 139 2 0.177489
48 granencuesta 0 1067 2 0.248366
49 vicramig 0 126 2 0
50 migueluribet 24 14663 2 0.086377
53 noticiascaracol 70 3076 2 0.177098
63 palomasenadora 0 145 3 0
64 cantorwerner 91 474 0 0.252492
68 macdonal5 495 248 0 0.130538
70 caracoltv 11 561 1 0.379085
72 eltiempo 247 5391 2 0.167852
74 andresguerraho 0 157 5 0
75 alfredoramosm 0 821 5 0.095238
82 jerobledo 26 3339 1 0.151429
83 sergio_fajardo 8 5253 1 0.124044
94 cablenoticias 127 291 2 0.365385
95 wicarni 206 210 0 0.166122
96 caracolradio 888 1278 5 0.137634
97 hora20 0 161 0 0.285714
102 aforerom 18 455 2 0.430556
108 lasillavacia 17 219 1 0.327273
110 andrescamilohr 103 2118 0 0.238295
111 pizarromariajo 2 1046 0 0.30303
112 gustavobolivar 9 5741 0 0.169515
114 charry_manager 33 305 0 0.341991
115 davidracero 0 584 0 0.216667
119 rijecas 64 196 2 0.15368
120 invamer 0 483 2 0.066667
121 cne_colombia 0 1105 2 0.07619
122 moecolombia 2 397 5 0.133333
123 pgn_col 0 748 1 0.109091
124 fiscaliacol 0 372 1 0.136364

Tabla 2. Producción de tweets, menciones y dinamismo de los clusters.

La figura 9 ejemplifica la intensidad y producción de mensajes desde las etiquetas, que empieza a marcar las aristas y los grados de racionalidad entre los nodos y la conformación de comunidades que, en relación al proceso electoral, empiezan a consolidarse, para luego, entrar en discusiones que demarca un grado alto de interactividad.

Figura 9. Etiquetas de mayor movimiento el día de las elecciones.

Empresas de información, como canales de televisión, medios impresos, radiales, blogs, son actores fundamentales, que, más allá de producir información, permiten la consolidación de comunidades, así como movimientos interactivos, desde la réplica o reposteo de tweets de los candidatos a la alcaldía, siendo fuente clave para la construcción de opiniones y marcadores de referencia del proceso.  Como lo permite ver la figura 10 los nodos del ecosistema mediático son los candidatos a la alcaldía (perfiles de twitter) y medios como kienyke, caracol radio, semana (Figura 11), contribuyen a dinamizar los grados de relacionalidad de los ciudadanos hacia estos.

Figura 10. Caracterización nodos y aristas

La red permite ver:

  • No existe polarización o grados de dispersión, efecto que obedece a la articulación de los nodos centrales en relación a la temática (elecciones y temas de campaña)
  • Las comunidades lejanas se caracterizan por hacer alusión a procesos electorales particulares, que toman como referencia el caso bogotano (como la comunidad de medios argentinos que afianza la relevancia de la elección con el turismo entre su capital y Bogotá)
  • Un nodo de gran peso es el que se forma desde la candidata –ahora alcaldesa- Claudia López.    Colectivos empiezan a organizarse desde sus mensajes, conectándolos con etiquetas como feminismo, desarrollo medioambiental, educación de calidad.
  • Este nodo es el que más se relaciona con los otros, medida establecida a partir de los cruces de contendidos que se generaron.

Cuando, a través de Gephy se ubican los nodos de mayor peso, aparecen, como en la siguiente ampliación, Claudia López y Holman Morris, ganando centralidad y dinamizando la gravitación de usuarios; debe destacarse que estos movimientos se encuentran a relación a una posible similitud en los posibles votantes de los candidatos (información que se establece desde los contenidos y temáticas de discusión, pero que queda abierta a una revisión más completa).

La centralidad de nodo de Claudia López se vuelve un dinamizador de canales y articulación de segmentos que configuran poblaciones de votantes manifiestos, que constantemente están direccionándose y haciendo confluyente la direccionalidad de los flujos de información hacia este nodo, como se ve a continuación:

De hecho las comunidades que se forman desde medios de comunicación, adquieren relevancia desde la articulación directa con este nodo central:

El nodo de Claudia López empieza a formalizarse como líder de opinión en twitter durante el proceso electoral, de hecho, los medios de comunicación gravitan alrededor de los contenidos y los reposteos que desde allí se generan, mostrando como este nodo se vuelve un configurador de atmósferas de opinión:

Desde allí se delimitan los medios que más generan comentarios y re-postean las publicaciones de los nodos centrales (Figura 11) y extienden categorías generadoras de hashtags (figura 12) que giran alrededor del procesos electoral y la invitación a que los bogotanos asistan masivamente a las urnas como un acto de resistencia ante los sistemas tradicionales de gobierno local, procesos que se materializa en las palabras de mayor frecuencia (Figura 13), componentes clave desde los cuales se estructuran las atmósferas de opinión en torno a temáticas puntuales, correlacionadas con los contenidos que se direccionan desde los nodos.

Figura 11. Medios dinamizadores de los contenidos de los nodos.

Figura 12. Palabras generadoras de hashtags

Figura 13. Palabras de mayor frecuencia en los tweets

  • Conclusiones 

Se puede evidenciar que los procesos electorales generan flujos de conversación alta que inciden en picos de opinión pública  a partir de situaciones coyunturales, al usar Google Trends, se pueden ver los picos de búsqueda en el mes de las elecciones a la alcaldía, y el fuerte posicionamiento de Claudia Lopez antes y puntualmente después de ganar las elecciones. La inmediatez de las dinámicas de redes sociales puede evidenciarse en como los motores de búsqueda responden a la necesidad de información de los ciberusuarios.

En estas nuevas dinámicas se siguen estableciendo los mismos modelos de Líderes de opinión que los días previos a las elecciones funcionaron como nodos que visibilizaron a aquellos que reforzaban sus virtudes frente a los otros candidatos, por lo cual en los últimos días disminuye la producción de contenido propio para empezar a replicar a el contenido de los ciudadanos que apoyaban a cada candidato.

 Las comunidades virtuales empiezan a generar comportamientos que les permitan ser tendencia por ende una vez un hashtag toma fuerza se empieza a mover mediante los nodos que mueven la información que en este caso son los candidatos, una vez el candidato empieza a mover el # sus seguidores más cercanos lo replican hasta llegar al ciberciudadano que siente una acción de empoderamiento al compartir sus ideas desde la misma base ideológica de otros sujetos similares.

Los hashtag toman mucha fuerza en la medida que permiten generar dinámicas de debate las cuales se dispersan ya que mediante la exposición selectiva que se fortalece desde los algoritmos de las redes sociales, los ciberciudadanos se encuentran con tendencias ideológicas contrarias a las suyas por lo cual se ve obligado a salir de dicha exposición para tener que enfrentarse a dar un argumento u opinión más destacada que la del contrario eso mediante la opción de responder a diferentes tuits o hashtag que ponen un mismo tema de conversación sobre la mesa.

Dentro de las recomendaciones, se precisa la posibilidad de análisis profundo de contenidos, que permita ampliar las dimensiones de los datos establecidos, si bien aplicaciones como Gephy permite ver las dinámicas de modulación de los datos, quedan faltando mecanismos para ahondar en los sentidos que se construyen desde los tweets, aspecto que planea una limitación del estudio.     A su vez, deben revisarse mecanismos analíticos que permitan afinar las posibilidades de inferir desde los datos, la relación existente entre las dinámicas y formaciones de atmosferas de opinión y su repercusión en la materialización del proceso en las urnas; si bien los nodos pueden darnos un indicio de la relación de los pesos y direccionalidades con las determinaciones de las intencionalidades de votos, quedan faltando insumos para poder afianzar esta conclusión.

Finalmente, aunque  se podría decir que  entre los usuarios que más participaron (figura 11) se encuentran algunos medios como Revista Semana y Caracol Radio, las mayores acciones dinamizadoras de la conversación se vuelven visibles desde acciones simples en la red ( retwitt, hashtag, Respuesta) que permiten aumentar el flujo de información hasta el punto que llega a muchos usuarios que se forman una opinión desde este tipo de plataformas, y esto podría generar un cambio en las dinámicas de poder respecto a quien controla los intereses y percepciones de los usuarios desde la formación de opinión co-construida con la ciudadanía.

  • Referencias

Almond, G. y Verba, S. (2001) La Cultura Política. En: Diez textos básicos de la cultura política. Pp. 171-201, Editorial Ariel, Barcelona

Castells, M (2009) Comunicación y Poder.  Traducción de María Hernández Díaz Madrid: Alianza Editorial, 2009, 679 p. isbn: 978-84-206-8499-4

Domínguez, N. (2012). Política 2.0: el uso de las redes sociales en la política argentina. Anuario Electrónico de Estudios en Comunicación Social “Disertaciones”, 5 (1), Artículo 5. Disponible en la siguiente dirección electrónica: http://erevistas.saber.ula.ve/index.php/Disertaciones/

García, G. (2017).   Estrategia y publicidad electoral: los spots de campaña en Andalucía 2008 y 2012. RIPS. Revista de Investigaciones Políticas y Sociológicas, vol. 16, núm. 2, 2017, pp. 161- 186. Universidad de Santiago de Compostela, España. Disponible: http://www.redalyc.org/articulo.oa?id=38054082009

Hernández Sampieri, R., Fernández Collado, C., Baptista Lucio, P. (2010). (5a Edicion)Metodología de la Investigación. McGraw Hill: México D.F. 

Jenkins, H (2008) Convergence Culture. La cultura de la convergencia de los medios de comunicación. Editorial Paidós, Barcelona.

Lévy, P. (2007). Cibercultura. La cultura de la sociedad digital. [Informe al Consejo de Europa]. Prólogo: Manuel Medina. Barcelona: Rubí; México: Anthropos, Universidad Autónoma Metropolitana. isbn: 978-84-7658-808-

López Abellán, M. (2012) Twitter como instrumento de comunicación política en campaña: Elecciones Generales 2011. Cuadernos de Gestión de Información. (2012) p.69-p.84. ISSN 2253-8429

Marcos, S., Alonso, L. y Casero, A. (2017). Usos ciudadanos de Twitter en eventos políticos relevantes. La #SesiónDeInvestidura de Pedro Sánchez. Revista interdisciplinar de Ciencias de la Comunicación y Humanidades. Nuevas formas de Comunicación Política II. Revista Comunicación y Hombre N° 13. Universitat Jaume I Castellón de la Plana, España.

Sánchez, L., López, W. y Barreto, I (2013).   Enmarcamiento cognitivo de la cultura política. Un análisis desde las redes sociales en Internet (Twitter). Revista interamericana de Psicología, Vol. 47. Núm. 3. Pp. 383-394.  Disponible en: http://www.redalyc.org/pdf/284/28432389003.pdf

Scolari, C (2008) Hipermediaciones. Elementos para una Teoría de la Comunicación Digital Interactiva. Gedisa Editorial

Trillos, J. (2015). La comunicación contemporánea en el circuito de la opinión pública y las relaciones de poder en red. En: Comunicación, Política, relaciones de poder y opinión pública en la red.  En: Comunicación política, relaciones de poder y opinión pública en la Red. Universidad de la Costa, Barranquilla – Colombia.

Comunicación Financiera – Mini Proyecto Modulo 1

Comunicación Financiera

Henry Antonio Romero León

Introducción

La comunicación financiera constituye un factor relevante en los mercados financieros y en general en una cultura que cada vez se ve más abocada a procesos de financiarización. Conocer cuáles son las redes de flujo de información que se crean a través de una red social a la luz de las palabras comunicación financiera resulta de interés para explorar y describir usos y sentidos de la expresión y preliminarmente comprender las potencialidades de este tópico para desarrollar investigación futura a profundidad sobre el mismo tema.

En igual sentido la recurrencia de los términos en la red social Twitter permite ubicar los flujos de información y las frecuencias alrededor de los mismos. Identificar grupos de interés, usuarios influyentes, configurando comunidades digitales alrededor, es necesario para allegar dinámicas de comunicación financiera en redes sociales. En este ejercicio es importante señalar que, si bien esta es una herramienta potente para el análisis funcional de comunidades, por efecto de tiempo y categorización de la base de datos conformada, la red social empleada, el alcance y profundidad del análisis se ve un tanto reducido y limitado.

Interesa con este proyecto identificar las formas en que se han usado las palabras “comunicación financiera” principalmente durante el periodo comprendido entre el 10 de febrero y el 17 de febrero de 2020 en Colombia. Alrededor de la comunicación financiera se puede evaluar la eficacia y efectividad que esta tiene en la toma de decisiones, sin embargo, los usos en el lenguaje corriente expresados en redes sociales pueden no ser suficientes para evaluarlas en sus efectos sustantivos. Aun así, es posible preguntarnos ¿cuáles son las frecuencias de uso, sentidos y las redes configuradas alrededor de las palabras comunicación financiera en Colombia en la red social twitter en el periodo comprendido entre el 10 de febrero y el 17 de febrero de 2020?

  1. Métodos y herramientas.

A través del uso de DMI -TCAT sobre la base de la pregunta descrita se analiza los tópicos de interés. Para esto se hizo necesario no solo graficar los datos a través de Gephi sino además hacer un ejercicio de filtrado a través de hoja de cálculo. La base de datos obtenida en el lapso de tiempo señalado ascendió a 22.444 menciones en tweets determinadas por las palabras comunicación financiera y toma de decisiones, las cuales no necesariamente aparecieron conjuntas.

  1. Datos y Análisis descriptivo

Los datos relacionados a continuación resumen la cantidad de tweets y la frecuencia de las palabras de interés, así como las redes conformadas alrededor de nodos de diversa naturaleza, que describiremos y arriesgaremos algunos elementos de interpretación de los mismos.

Tabla No. 1 Número y tipo de Tweets

Fuente: Datos obtenidos a través de DMI-TCAT

En la tabla anterior podemos apreciar que el total de tweets es de 343 en el periodo definido, los tweets con vínculos incorporados fueron de 28, con hashtags 107 con menciones de usuarios 314, con carga de imágenes o video fue de 19, los retweets fueron de 258 y las réplicas de 41. Con esta primera caracterización se observa que dista mucho de la cifra 22.444 que hace alusión a la totalidad de menciones de las palabras relacionadas, las que se pueden repetir en cada tweet y se pueden hallar de manera separada. Por ejemplo, la palabra comunicación se emplea de muy diversas formas. En ocasiones refiriendo a programas de formación en comunicación social y en otros como la comunicación emitida por una entidad hacia sus interesados.

Tabla No. 2 Frecuencia de Palabra

Fuente: Datos obtenidos a través de DMI-TCAT

La frecuencia de palabra nos deja ver que en fechas muy puntuales la frecuencia en el uso de las palabras obedece a coyunturas y estas se ven reflejadas en la red social. Las reacciones que se pueden desencadenar por las declaraciones de un ente gubernamental, una autoridad o un influencer son detonantes en tales momentos, lo que explica en gran medida que en el lapso de tiempo observado las frecuencias estén concentradas. La herramienta empleada identifica palabras, pero no es claro si puede identificar expresiones, es decir palabras compuestas, lo que no facilita observar nada sobre la expresión de interés comunicación financiera.

Tabla No. 3 Nodos más Influyentes

Fuente: Datos obtenidos a través de DMI-TCAT

Los nodos que representan usuarios mas influyentes se convierten en los centros desde donde se teje una red. Son de interés cuatro de los relacionados en la Tabla No. 3 por que se refiere al que en el periodo de tiempo tuvo mayor influencia, el surgido a raíz de un personaje público del gobierno nacional, de una autoridad regulativa y uno sectorial cooperativo.

Gráfica No. 1 Red desde el nodo más influyente

Fuente: Datos obtenidos a través de DMI-TCAT

El usuario “sophiahouse” representa el nodo más inlfluyente y alrededor del cual se creó la red más numerosa. Esta usuaria manifestó el día 15 de febrero a las 15:24 lo siguiente:

“¡Qué tal! Este degenerado sumió a Colombia en la más profunda crisis financiera y fiscal (Año 2000), la caída del PIB de más del 4% mandó a la pobreza a millones y con él comenzó la expansión del fenómeno paramilitar en Colombia. No me crean, búsquenlo, es historia patria.”

La palabra vinculada es “financiera”, la que en el contexto del tweet refiere a la crisis generada por un gobernante en particular. El sentido de la expresión financiera es calificar y delimitar una crisis sobre la cual se esta denunciando un responsable gobernante. El impacto en los usuarios de twitter vinculados a esta usuaria es importante para los datos observados, pues fue la mayor red que se creó. La naturaleza política del tweet por un lado, su carácter de denuncia impactan significativamente en las opiniones de seguidores y vinculados generando en gran medida un efecto en cadena de retweets. Este nodo representa un modulo pues solo se vincula a otras redes por dos usuarios quienes retweetean dos tweets diferentes a dos comunidades separadas sin vinculo directo.

Gráfica No. 2 Red desde el nodo gubernamental más influyente

Fuente: Datos obtenidos a través de DMI-TCAT

En la grafica No. 2 se ha representado una red alrededor de la usuaria mluciaramirez quien el 14 de febrero a las 20:36 escribió:

“Antioquia tendrá plan piloto para impartir educación financiera a las mujeres de la región; en articulación con la Gobernación, Alcaldía de Medellín y sector privado. La economía de Colombia se impulsará si generamos más inclusión y empoderamiento de las mujeres. https://t.co/gwdRbIIq4B”

Es un modulo aislado en tanto no tiene vínculo con otros pero que, a raíz de una declaración oficial de la vicepresidenta de Colombia, en este caso sobre educación financiera, desencadena opiniones de diversa índole, en su mayoría de difusión como retweets. Como vemos el contexto de la expresión financiera ya no es crisis, sino educación, lo que presenta un sentido muy diferente al analizado anteriormente, haciendo la conexión entre estas dos redes muy débil.

Gráfica No. 3 Red sectorial

Fuente: Datos obtenidos a través de DMI-TCAT

Esta red que se caracteriza por ser sectorial, pues los usuarios son entidades pertenecientes o vinculadas con el sector cooperativos y que registran comunicaciones relacionadas con la Convención Financiera Cooperativa, no representa un centro nodal plenamente identificado es una red que por pertenecer al mismo sector económico, el flujo de información y en este caso principalmente del VI Convención Financiera Cooperativa, es natural que los tweets sean divulgativos sobre un evento en común y no constituye una declaración de un nodo central. El sentido y uso de la palabra financiera es distinto a los dos anteriores en tanto expresa la denominación, carácter y naturaleza de un evento realizado el año pasado y que es de interés referencial para los miembros de esa red.

Gráfica No. 4 Red desde nodo de la autoridad regulativa

Fuente: Datos obtenidos a través de DMI-TCAT

En esta Gráfica No. 4 observamos que el nodo principal es el usuario SFCsupervisor que corresponde a la Superintendencia Financiera de Colombia y a partir de la cual se crea una red con tres tweets. El principal es una invitación a informarse en el portal de la Superfinanciera sobre la información financiera en el primer trimestre del año, el segundo es un tweet que remite a observar una entrevista del Superintendente Financiero en un medio de divulgación y el tercero es un retweet de un canal deportivo sobre una operación financiera en el mercado de jugadores. La red que se teje desde este nodo es muy variada. Es claro que son tres tweets muy diferentes en los que los usos de la palabra financiera son muy distintos.

  1. Conclusiones

Una vez examinado selectivamente los datos, redes mas representativas, usuarios y deducido los sentidos de las expresiones comunicación financiera dados los contextos de enunciación, con la asistencia de DMI-TCAT y la graficación de tales datos con el programa Gephi es posible concluir lo siguiente:

Desde el punto de vista de la pregunta de indagación fue posible identificar que los usos de la expresión comunicación y financiera tienen sentidos muy diferenciados en la manera como se usa la red social Twitter. No se puede sacar una conclusión única en tanto los usos son diferentes. Si es posible tipificar que la expresión ha sido empleada como el contenido de una valoración política y de opinión frente a una crisis pasada, como un programa educativo del gobierno, como la caracterización de un evento dentro de un sector de la economía y como el llamado de una autoridad financiera a consultar un medio de divulgación más formal y preciso.

Se pudo encontrar que puede haber una relación entre el tipo de usuario y el sentido de los tweets, que marca el uso de la red social. La apertura y desbordamiento en calificaciones de un usuario general con influencia es mas evidente que un usuario que ostente una función pública, de ente regulador o pertenecientes a un sector.

Las frecuencias arrojadas por TCAT son importantes desde el plano cuantitativo, pero en términos cualitativos hay que hacer una inmersión detallada para una comprensión adecuada de un problema a profundidad. Los datos cuantitativos nos dan a entender frecuencias de uso, pero no usos en particular constituyendo esto una limitación importante.

Las redes conformadas con estos datos en el lapso de tiempo se comportan modularmente, entendido esto como nodos independientemente, aislados, cuyas conexiones por lo general no son sustantivas, sino solamente de usuarios. Calificar una red de conexiones como una comunidad no es del todo fácil, sin embargo, una comunidad digital es posible en tanto las relaciones a través del mismo medio de comunicación son fácticas. En cuanto al contenido de lo comunicado puede haber identidad en la medida que se retweetea en el mismo sentido. No dejan de ser redes y comunidades artificiales que no exigen vincularidad espacial y temporal necesariamente. Pueden ser comunidad en ciertos aspectos pero en el sentido tradicional y social de una comunidad puede ser mínimo lo común de sus miembros.

Como herramienta de obtención de datos y sistematización de los mismos, TCAT es muy potente sin embargo análisis a profundidad y sustantivos de redes sociales reales requieren de mayor inmersión, siendo así TCAT es la herramienta ideal necesaria para iniciar un análisis más profundo sobre una base manifiesta y no sesgada por el investigador al tomar datos de manera convencional.

  1. Referencias

Cioffi-Revilla, Claudio. 2010. “Computational social science”. Wiley Interdisciplinary Reviews: Computational Statistics 2(3): 259–271.

Grandjean, M. (2016). A social network analysis of Twitter: Mapping the digital humanities community. Cogent Arts & Humanities, 3(1), 1171458.

Neuman, W. Lawrence. 2006. Social research methods: qualitative and quantitative approaches. Boston: Pearson/AandB.

Ruiz Bolivar, C. (2008) El enfoque multimetodo en la investigacion social y educativa: una mirada desde el paradigma de la complejidad. Revista de filosofia y sociopolitica de la educacion TERE.

¿Por qué Big Data necesita Thick Data?

Wang, T. (2016) ¿Por qué Big Data necesita Thick Data?

Por, Luis Felipe Navarrete

Dentro de las posibilidades establecidas por los enfoques mixtos de investigación, Tricia Wang resalta la importancia de acompañar la recopilación y análisis de Big Data (Grandes masas de datos) con Thick Data (Datos espesos).  Thick Data hace referencia a datos que proceden de métodos cualitativos y que recopilan, en muestras pequeñas, datos profundos que configuran o se tejen en historias y permiten ahondar en emociones, miedo, cosmovisiones y aspectos de la subjetividad humana y que dan cuenta de la riqueza de las experiencias de los fenómenos: “Es aquella sustancia pegajosa que es difícil de cuantificar” (Wang, 2016)

Wang se remite a su experiencia en la compañía Nokia y la prioridad que daban a los datos cuantitativos, desconociendo procesos sociales que podían dar cuenta de la acogida y anclaje de sus productos en comunidades particulares.    Mientras la compañía avanzaba en la sistematización de millones de datos, Wang conversaba con la gente, hacia trabajo de campo en China (enriquecida en sus trabajos en cafés internet y ventas ambulantes), perspectiva que le permitió ver que las clases bajas estaban dispuestas a adquirieran Smartphone de alto costo. La compañía descartó el valor de estos resultados, desconociendo los procesos culturales que determinan fenómenos de consumo.

Los mercados han encontrado un amplio potencial y confianza en los datos, que en ocasiones les lleva a minimizar el impacto y relevancia de la labor etnografía y la descripción de las experiencias desde las cuales se extraen los datos.  Pero, a pesar del respaldo que históricamente han tenidos los datos cuantitativos, ciertos fenómenos de las ciencias sociales han dejado claro que “Más números no necesariamente producen más conocimientos” (Wang, 2016)

Desde esta perspectiva la mezcla de Big Data con Thick Data permitiría amplia el contexto del que –en múltiples ocasiones carecen los datos, establecer diferentes dimensiones y aperturar posibilidades de conocimiento, en escalas diferencias y/o simultaneas.    Los patrones establecidos por el Big Data, pueden encontrar rutas de comprensión del contexto social en el Thick Data, de esta manera, las decisiones que se toman desde la definición de patrones y algoritmos no desconocerían la complejidad de las experiencias humanas; Siguiendo a C. Thompson, Wang señala que el dato mide, proyecta, pero debe complementarse con el dialogo, el debate, la situación, para dotarse de una dimensión moral. De esta manera el Thick Data ayudaría a comprender el acoplamiento o las posibilidades de anclaje de ciertos proyectos, productos o iniciativas en entornos situados.  Esto representa una oportunidad para el trabajo etnográfico, así como para el ejercicio de la re-configuración de grandes bases de datos, pues, en muchas oportunidades, de las grandes bases de datos, se usan apenas pequeños porcentajes, debido a la descontextualización y des-narrativización de la cifra.

¿Qué opciones metodológicas aparecen cuando los resultados del análisis de Big Data y de Thick Data se contraponen?

¿Cómo incorporar resultados de Thick Data a la elaboración de políticas públicas, atendiendo a la consideración negativa que se tiene sobre la representatividad de sus muestras ?

Introducción a los Métodos del Análisis de Redes Sociales

Reflexión No. 3

Introducción a los Métodos del Análisis de Redes Sociales de Robert A. Hanneman (1998)

Autor: Henry Romero

El texto de Robert Hanneman describe las características de los métodos de análisis de redes sociales desde su alcance hasta las diferentes formas en que se pueden construir redes de relaciones, pasando por la explicación de por qué tales métodos se centran más en estadística descriptiva que en la inferencial. En esta reflexión centraré la atención en los puntos que juzgo problemáticos.

El análisis de redes sociales es una perspectiva de métodos que responden a dimensiones sociales que no siempre se valoraron. Lo distintivo según Hanneman es que “la mayor diferencia entre los datos convencionales y los reticulares, es que los datos convencionales se centran en actores y atributos mientras los datos de red se centran en actores y relaciones”. En este sentido son las relaciones y no los atributos de los objetos observados, las que se vuelven relevantes.

La existencia de redes sociales siempre ha estado presente, pero el interés por ellas y haberlas hecho explícitas en las investigaciones sociales es relativamente reciente gracias a la aplicación de la teoría de grafos a la descripción social. Si bien la ciencia ha buscado las relaciones entre variables y las causas de su variabilidad; con el interés en la relación del análisis de redes sociales, podemos decir que la relación sirve para describir el vínculo entre actores sociales y no las características de estos, representando un avance en el análisis social.

Los métodos de redes son un instrumento muy potente para analizar las relaciones entre individuos en investigación social pues potencializan la interpretación de los vínculos entre actores, que por lo general son los detonadores y factores explicativos de los problemas sociales. A pesar de permitir acceso a una mayor cantidad de datos, en tanto los análisis por lo general abordan las poblaciones completas al no hacer muestreos explícitos superando las limitaciones, errores e imprecisiones tradicionales del muestreo y la inferencia estadística, los datos que presentan las relaciones se limitan a una formalidad y no ofrecen contenido relacional a profundidad, es decir que no pueden ir más allá de un dato estático. Por ejemplo, en los casos señalados por Hanneman preguntar a un actor si su afecto es positivo o negativo frente a otro, probablemente nos indique quien resulta tener o no mayores afectos en una red social, pero no nos dirá mucho sobre las causas, el contexto, naturaleza e intensidad de tales afectos, los que cualitativamente no se expresan en la relación gráfica formal.

Los métodos de análisis de redes están sujetos a la recolección de datos de manera tradicional, por lo general entrevistas estructuradas o semiestructuradas. En los años en que se escribió y publicó el texto de Hanneman, la incursión de las redes sociales digitales aún no se había dado, lo que hacía de estos métodos algo con una importante proyección. La aparición de las redes sociales digitales ha potencializado estos métodos, pues basta con rastrear las redes sociales mismas e identificar las relaciones y los nodos. Esto no quiere decir que sea suficiente; por el contrario, la forma como las redes sociales reflejan relaciones sociales reales es un problema a resolver, pues el medio digital ha transformado la naturaleza de la propia relación social. Del mismo modo los volúmenes de información se han convertido en big data, posibilitando mejores aproximaciones descriptivas a las que se lograban con las formas tradicionales.

Una condición del análisis de redes es su carácter solamente descriptivo y limitado a la medición, el cual es muy importante y válido para mostrar patrones de relacionamiento. Siendo así, es aun legítimo preguntarnos si los procesos sociales y relacionales pueden ser representados con la teoría matemática de grafos ¿requiere acaso de estudios longitudinales necesariamente?

El enfoque de redes sociales es importante, pero cabe desatacar que hay una diferencia significativa del tipo relacional que se prioriza en las redes sociales y es que las relaciones de tipo material pueden ser objetivas, por ejemplo, los flujos migratorios o los flujos comerciales y económicos o financieros, sobre los cuales el analisis de redes es muy potente y cuantitativamente preciso. Pero las relaciones de tipo cualitativo, por ejemplo, las de orden emocional solo tienen un carácter manifiesto por los actores y asignados como valores dentro de una escala, con poca profundidad y reduciendo todo lo social a datos medidos y representados tendenciosamente en un momento estático. Si bien esto no es un desperfecto de los métodos en sí mismos, si nos muestra una vez más la naturaleza muy subjetiva de algunos aspectos sociales que son explicativamente de relevancia en las investigaciones sociales y la dificultad de asirlos metodológicamente.