PROYECTO ESTADÍSTICA
MÉTODOS AVANZADOS DE INVESTIGACIÓN
Profesora Diana Lucio-Arias.
Maria Mercedes Corral Strassmann
Abril 2 de 2020
Contenido
1 INTRODUCCION Y OBJETIVO
En este proyecto se pretende realizar una pequeña investigación preliminar para consecución de datos utilizando herramientas avanzadas para este fin. Los datos se obtienen en este caso con la red social Twitter; para el caso de mi investigación relacionada con universidades, sus funciones, misiones, y relaciones con su entorno, la idea es buscar información a través de Twitter que permita realizar algún análisis relacionado con el propósito de la investigación y poder generar algunas conclusiones.
Las posibles preguntas previas a la investigación serían:
- ¿Qué tanto se relacionan las universidades con otros actores o con las mismas universidades, a través de Twitter?
- ¿Tienen alguna incidencia variables como el tipo de universidad (pública- privada), numero de programas, número de estudiantes, entre otros?
2 DATOS
Como datos para este proyecto se toman los siguientes:
- Se utiliza la red social Twitter como fuente de datos
- Se toma la Base de SNIES de las universidades de Colombia y de aquí se extraen únicamente las certificadas en calidad, que son 60.
- Se investigan los “user name” y “user id” de twitter de este rango de Universidades
- Se crea un “bin” en el TCAT con los tweet-id de las universidades certificadas en calidad.
- De este “bin” se obtienen 1621 registros que contienen tweets de las universidades.
- Se investigan el número de estudiantes de cada una de estas universidades
- Se toma del SNIES el número de programas de cada Universidad.
- Se crea la matriz con las variables que se muestran en la misma, tomadas del full-export de twitter más algunas definidas en correlación con los tweets.
- Se generan tres data set con la siguiente información:
- Información sobre los TW posteados por las
universidades acreditadas en Colombia en el intervalo definido (feb 25 a mar 6
de 2020), identificando cada en la red TW, cuantificando variables como número
de TW, menciones, seguidores, amigos y favorito. Se clasifican como tweet y
re-tweet (0/1) (Export)
- Información sobre los destinatarios de las menciones o RT bajo una clasificación definida 1 interno, 2 otras universidades acreditadas, 3 3 entidades gubernamentales, 4 medios de comunicación, 5 universidades no acreditadas Colombia, 6 universidades fuera de Colombia, 7 otras entidades, 8 otros/personas
- Información base de las universidades certificadas en Colombia, que incluye la naturaleza jurídica, número de estudiantes y programas ofrecidos, tomada del SNIES a la cual se le adiciona la información del número de TW, seguidores, amigos y favoritos, así como la clasificación de los destinatarios de los TW o RT definida
- La definición de cada variable como independiente o
dependiente, se realizó de acuerdo con el siguiente criterio:
- Se consideran independientes las variables relacionadas con la estructura universitaria, independiente de la operación de la red de Twitter
- Se consideran dependientes las variables que dan cuenta del tipo y número de relaciones que cada universidad tiene con otros actores de su entorno a través de la red TW
Se anexan las Tablas correspondientes.
No se incluye en este proyecto análisis de contenido de tweets
3 ANÁLISIS
Se caracterizaron las universidades acreditadas en Colombia por el número de TW o RT generados durante el período de análisis, encontrándose que 35% de ellas (21) no generaron ningún TW o RT en el período analizado; de este grupo el 38% son universidades públicas y 62% privadas.
Nro. TW o RT por Universidad | Nro. De Universidades | % | |
0 TW o RT | 1 | 21 | 35.0 |
De 1 a 15 | 25 | 14 | 23.3 |
De 16 a 30 | 50 | 13 | 21.7 |
De 31 a 50 | 100 | 9 | 15.0 |
De 51 y más | 3 | 5.0 | |
Total | 60 | 100.0 |
3.1 Nro. TW o RT por Universidad
Se caracterizaron las universidades acreditadas en Colombia, por naturaleza jurídica, con las variables de estudiantes, programas, el número de TW, seguidores y amigos. Se generaron indicadores de TW o RT por 1000 estudiantes y el número de seguidores por estudiante y favoritos por seguidores. Se destaca que, si bien los estudiantes atendidos por las universidades públicas analizadas corresponden al 67%, los TW publicados por estas universidades corresponden solamente al 29% del total de TW, esto genera una diferencia importante en el indicador de número de TW o RT por 1000 estudiantes que es cinco veces mayor en las privadas que en las públicas (4.06 vs 0.82)
Valores | Pública | Privada | Total general | Pública | Privada |
Nro instituciones | 19 | 41 | 60 | 32% | 68% |
Nro estudiantes | 585,077 | 281,872 | 866,949 | 67% | 33% |
Nro programas | 2,717 | 4,298 | 7,015 | 39% | 61% |
Nro TW o RT | 479 | 1145 | 1624 | 29% | 71% |
Suma de Nro. Max favoritos | 28,001 | 105,978 | 133,979 | 21% | 79% |
Suma de Nro. Max amigos | 9,043 | 43,132 | 52,175 | 17% | 83% |
Nro máximo amigos | 617,070 | 699,282 | 1,316,352 | 47% | 53% |
TW/RT por estudiante (x 1000) | 0.82 | 4.06 | 1.87 | ||
Estudiantes por programa | 215 | 66 | 124 | ||
Seguidores por estudiante | 0.0 | 0.4 | 0.2 | ||
Favoritos/Seguidores | 32.3 | 40.7 | 38.9 |
Para las universidades con por lo menos un TW o RT en el periodo de análisis, se calcularon indicadores de tendencia central del número de TW o RT, seguidores y favoritos, encontrándose una alta dispersión de los datos
TW/RT | Nro. Max seguidores | Nro. Max favoritos | |
Promedio | 43 | 34,641 | 3,526 |
Mediana | 32 | 17,178 | 1,864 |
Moda | 31 | ||
Desv. Estandar | 33.2 | 56,733.8 | 4,177.4 |
Mínimo | 2 | 1,401 | 82 |
Máximo | 137 | 327,156 | 16,862 |
Coef. Variación | 0.78 | 1.64 | 1.18 |
Varianza | 1,103 | 3,218,723,262 | 17,450,455 |
En relación con las menciones y RT se clasificaron por tipo de destinario de manera desagregada por naturaleza jurídica de la universidad. Se destaca que la mayor proporción de menciones o RT está destinada a grupos de la misma universidad (38,4% en el total de universidades, mayor proporción en las públicas (46% y 38% privadas). Otro destinatario importante son las entidades del gobierno, 12,7% del total y 18% en las públicas y 11% en las privadas.
4 CONCLUSIONES Y PREGUNTAS
Si bien se trata de un data set que cubre los TW generados durante un periodo de 10 días, se observan diferencias importantes en el comportamiento de las universidades. Se destaca que 35% de las universidades acreditadas en Colombia no generaron TW en dicho periodo. Sería importante ampliar el periodo de observación con el fin de revisar la consistencia de los datos y determinar la importancia que le dan estas entidades Twitter a este medio para relacionarse en la sociedad en general.
4.1 De encontrarse que un número importante de universidades no utiliza este medio, cabe preguntarse ¿por qué no utilizan este medio y a través de que medios se relacionan con las comunidades universitarias?
La naturaleza jurídica de las universidades afecta los resultados de los indicadores analizados, se observa una mayor generación de TW o RT por cada 1000 estudiantes en las universidades privadas que en las públicas. En este contexto, es importante analizar a futuro las razones que llevan a que el número de mensajes de TW o RT por cada 1000 estudiantes sea 4 veces mayor en las privadas que en las públicas.
4.2 ¿Es un de tema de brecha digital? ¿acceso a recursos, educación, ingresos?
De analizarse el contenido de los mensajes con herramientas como análisis de sentimientos, se podría caracterizar el tipo de mensajes que las universidades envían por este medio y evaluar:
4.3 ¿podría este medio de comunicación ser una herramienta que permite generar valoraciones de la vinculación de las universidades con su entorno de desempeño?
5 REFERENCIAS
GUIAS de las herramientas compartidas para este Módulo. TCAT.