Estadísticas MMCORRAL – Módulo 2 Miniproyecto

PROYECTO ESTADÍSTICA

MÉTODOS AVANZADOS DE INVESTIGACIÓN

                                                                       Profesora Diana Lucio-Arias.

Maria Mercedes Corral Strassmann

Abril 2 de 2020

  1.  

Contenido

. 1

PROYECTO ESTADÍSTICA.. 1

1       INTRODUCCION Y OBJETIVO.. 3

2       DATOS. 3

3       ANALISIS. 5

4       CONCLUSIONES. 7

5       REFERENCIAS. 8

  1.  

1         INTRODUCCION Y OBJETIVO

En este proyecto se pretende realizar una pequeña investigación preliminar para consecución de datos utilizando herramientas avanzadas para este fin. Los datos se obtienen en este caso con la red social Twitter; para el caso de mi investigación relacionada con universidades, sus funciones, misiones, y relaciones con su entorno, la idea es buscar información a través de Twitter que permita realizar algún análisis relacionado con el propósito de la investigación y poder generar algunas conclusiones.

Las posibles preguntas previas a la investigación serían:

  • ¿Qué tanto se relacionan las universidades con otros actores o con las mismas universidades, a través de Twitter?
  • ¿Tienen alguna incidencia variables como el tipo de universidad (pública- privada), numero de programas, número de estudiantes, entre otros?

2         DATOS

Como datos para este proyecto se toman los siguientes:

  • Se utiliza la red social Twitter como fuente de datos
  • Se toma la Base de SNIES de las universidades de Colombia y de aquí se extraen únicamente las certificadas en calidad, que son 60.
  • Se investigan los “user name” y “user id” de twitter de este rango de Universidades
  • Se crea un “bin” en el TCAT con los tweet-id de las universidades certificadas en calidad.
  • De este “bin” se obtienen 1621 registros que contienen tweets de las universidades.
  • Se investigan el número de estudiantes de cada una de estas universidades
  • Se toma del SNIES el número de programas de cada Universidad.
  • Se crea la matriz con las variables que se muestran en la misma, tomadas del full-export de twitter más algunas definidas en correlación con los tweets.
  • Se generan tres data set con la siguiente información:
  • Información sobre los TW posteados por las universidades acreditadas en Colombia en el intervalo definido (feb 25 a mar 6 de 2020), identificando cada en la red TW, cuantificando variables como número de TW, menciones, seguidores, amigos y favorito. Se clasifican como tweet y re-tweet (0/1) (Export)
    • Información sobre los destinatarios de las menciones o RT bajo una clasificación definida 1 interno, 2 otras universidades acreditadas, 3 3 entidades gubernamentales, 4 medios de comunicación, 5 universidades no acreditadas Colombia, 6 universidades fuera de Colombia, 7 otras entidades, 8 otros/personas
    • Información base de las universidades certificadas en Colombia, que incluye la naturaleza jurídica, número de estudiantes y programas ofrecidos, tomada del SNIES a la cual se le adiciona la información del número de TW, seguidores, amigos y favoritos, así como la clasificación de los destinatarios de los TW o RT definida
  • La definición de cada variable como independiente o dependiente, se realizó de acuerdo con el siguiente criterio:
    • Se consideran independientes las variables relacionadas con la estructura universitaria, independiente de la operación de la red de Twitter
    • Se consideran dependientes las variables que dan cuenta del tipo y número de relaciones que cada universidad tiene con otros actores de su entorno a través de la red TW

Se anexan las Tablas correspondientes.

No se incluye en este proyecto análisis de contenido de tweets

3         ANÁLISIS

Se caracterizaron las universidades acreditadas en Colombia por el número de TW o RT generados durante el período de análisis, encontrándose que 35% de ellas (21) no generaron ningún TW o RT en el período analizado; de este grupo el 38% son universidades públicas y 62% privadas.

Nro. TW o RT por Universidad Nro. De Universidades %
0 TW o  RT 1 21 35.0
De 1 a 15 25 14 23.3
De 16 a 30 50 13 21.7
De 31 a 50 100 9 15.0
De 51 y más 3 5.0
Total 60 100.0

3.1        Nro. TW o RT por Universidad

Se caracterizaron las universidades acreditadas en Colombia, por naturaleza jurídica, con las variables de estudiantes, programas, el número de TW, seguidores y amigos. Se generaron indicadores de TW o RT por 1000 estudiantes y el número de seguidores por estudiante y favoritos por seguidores. Se destaca que, si bien los estudiantes atendidos por las universidades públicas analizadas corresponden al 67%, los TW publicados por estas universidades corresponden solamente al 29% del total de TW, esto genera una diferencia importante en el indicador de número de TW o RT por 1000 estudiantes que es cinco veces mayor en las privadas que en las públicas (4.06 vs 0.82)

Valores Pública Privada Total general Pública Privada
Nro instituciones 19 41 60 32% 68%
Nro estudiantes 585,077 281,872 866,949 67% 33%
Nro programas 2,717 4,298 7,015 39% 61%
Nro TW o RT 479 1145 1624 29% 71%
Suma de Nro. Max favoritos 28,001 105,978 133,979 21% 79%
Suma de Nro. Max amigos 9,043 43,132 52,175 17% 83%
Nro máximo amigos 617,070 699,282 1,316,352 47% 53%
TW/RT por estudiante (x 1000) 0.82 4.06 1.87
Estudiantes por programa 215 66 124
Seguidores por estudiante 0.0 0.4 0.2
Favoritos/Seguidores 32.3 40.7 38.9

Para las universidades con por lo menos un TW o RT en el periodo de análisis, se calcularon indicadores de tendencia central del número de TW o RT, seguidores y favoritos, encontrándose una alta dispersión de los datos

TW/RT Nro. Max seguidores Nro. Max favoritos
Promedio 43 34,641 3,526
Mediana 32 17,178 1,864
Moda 31
Desv. Estandar 33.2 56,733.8 4,177.4
Mínimo 2 1,401 82
Máximo 137 327,156 16,862
Coef. Variación 0.78 1.64 1.18
Varianza 1,103 3,218,723,262 17,450,455

En relación con las menciones y RT se clasificaron por tipo de destinario de manera desagregada por naturaleza jurídica de la universidad. Se destaca que la mayor proporción de menciones o RT está destinada a grupos de la misma universidad (38,4% en el total de universidades, mayor proporción en las públicas (46% y 38% privadas). Otro destinatario importante son las entidades del gobierno, 12,7% del total y 18% en las públicas y 11% en las privadas.

4         CONCLUSIONES Y PREGUNTAS

Si bien se trata de un data set que cubre los TW generados durante un periodo de 10 días, se observan diferencias importantes en el comportamiento de las universidades. Se destaca que 35% de las universidades acreditadas en Colombia no generaron TW en dicho periodo. Sería importante ampliar el periodo de observación con el fin de revisar la consistencia de los datos y determinar la importancia que le dan estas entidades Twitter a este medio para relacionarse en la sociedad en general.

4.1        De encontrarse que un número importante de universidades no utiliza este medio, cabe preguntarse ¿por qué no utilizan este medio y a través de que medios se relacionan con las comunidades universitarias?

La naturaleza jurídica de las universidades afecta los resultados de los indicadores analizados, se observa una mayor generación de TW o RT por cada 1000 estudiantes en las universidades privadas que en las públicas.  En este contexto, es importante analizar a futuro las razones que llevan a que el número de mensajes de TW o RT por cada 1000 estudiantes sea 4 veces mayor en las privadas que en las públicas.

4.2        ¿Es un de tema de brecha digital? ¿acceso a recursos, educación, ingresos?

De analizarse el contenido de los mensajes con herramientas como análisis de sentimientos, se podría caracterizar el tipo de mensajes que las universidades envían por este medio y evaluar:

4.3      ¿podría este medio de comunicación ser una herramienta que permite generar valoraciones de la vinculación de las universidades con su entorno de desempeño?

5         REFERENCIAS

GUIAS de las herramientas compartidas para este Módulo. TCAT.

Modulo Estadísticas MMCORRAL

PROYECTO ESTADÍSTICA

MÉTODOS AVANZADOS DE INVESTIGACIÓN

                                                                       Profesora Diana Lucio-Arias.

Maria Mercedes Corral Strassmann

Marzo 9 de 2020

  1.  

Contenido

. 1

PROYECTO ESTADÍSTICA.. 1

1       INTRODUCCION Y OBJETIVO.. 3

2       DATOS. 3

3       ANALISIS. 4

4       CONCLUSIONES. 4

5       REFERENCIAS. 5

  1.  

1         INTRODUCCION Y OBJETIVO

En este proyecto se pretende realizar una pequeña investigación preliminar para consecución de datos utilizando herramientas avanzadas para este fin. Los datos se obtienen en este caso con la red social Twitter; para el caso de mi investigación relacionada con universidades, sus funciones, misiones, y relaciones con su entorno, la idea es buscar información a través de Twitter que permita realizar algún análisis relacionado con el propósito de la investigación y poder generar algunas conclusiones.

Las posibles preguntas que tengo serían:

  • ¿Qué tanto se relacionan las universidades con otros actores o con las mismas universidades, a través de Twitter?
  • ¿Tienen incidencia  variables como el tipo de universidad (pública- privada), numero de programas, numero de estudiantes, entre otros?

2         DATOS

Como datos para este proyecto se toman los siguientes:

  • Se utiliza la red social Twitter como fuente de datos
  • Se toma la Base de SNIES de las universidades de Colombia y de aquí se extraen únicamente las certificadas en calidad, que son 60.
  • Se investigan los “user name” y “user id” de twitter de este rango de Universidades
  • Se crea un “bin” en el TCAT con los tweet-id de las universidades certificadas en calidad.
  • De este “bin” se obtienen 1621 registros que contienen tweets de las universidades.
  • Se investigan el número de estudiantes de cada una de estas universidades
  • Se toma del SNIES el número de programas de cada Universidad.
  • Se crea la matriz con las variables que se muestran en la misma, tomadas del full-export de twitter más algunas definidas en correlación con los tweets.
  • Se generan tres data set con la siguiente información:
  • Información sobre los TW posteados por las universidades acreditadas en Colombia en el intervalo definido (feb 25 a mar 6 de 2020), identificando cada en la red TW, cuantificando variables como número de TW, menciones, seguidores, amigos y favorito. Se clasifican como tweet y re-tweet (0/1)
    • Información sobre las universidades certificadas en Colombia, teniendo la naturaleza jurídica, número de estudiantes y programas ofrecidos, así como el número de TW, seguidores, amigos y favoritos.
    • Información sobre los destinatarios de las menciones o RT bajo una clasificación definida 1 interno, 2 otras universidades acreditadas, 3 3 entidades gubernamentales, 4 medios de comunicación, 5 universidades no acreditadas Colombia, 6 universidades fuera de Colombia, 7 otras entidades, 8 otros/personas
  • La definición de cada variable como independiente o dependiente, se realizó de acuerdo con el siguiente criterio:
    • Se consideran independientes las variables relacionadas con la estructura universitaria, independiente de la operación de la red de Twitter
    • Se consideran dependientes las variables que dan cuenta del tipo y numero de relaciones que cada universidad tiene con otros actores de su entorno a través de la red TW

Se anexan las tablas:

Tabla export

Tabla Univ

Tabla mention – relaciones

No se incluye en este proyecto análisis de contenido de tweets

3         ANALISIS

4         CONCLUSIONES

5         REFERENCIAS