De Big Data a Smart Data
La aparición de “Big data” ha tenido un desarrollo muy rápido en estos años, a la vez que aparecen otros conceptos junto a éste como el “smart data” y en este artículo, Marcia Zeng presenta su entendimiento con el “que”, “por qué”, “cómo” “dónde” y “cuáles” datos en relación con Smart data y las humanidades digitales.
“QUE” es Smart data: Big data se ha caracterizado por poseer múltiples “V´s”, , Volumen, Velocidad, Variedad y ha sido complementado con Variabilidad y Veracidad. Big Data puede generar VALOR si se utiliza apropiadamente. Esta última “V”, depende del “Smart data” que se puede decir que se define como “la capacidad de lograr conocimientos desde datos veraces, contextualizados, relevantes, cognitivos, predictivos y consumibles en cualquier escala. (Kobielus, 2016, p. 8).
“POR QUË Smart data,
los datos en el siglo XXI son el activo más importante que puede generar valor
para quienes aprenden a extraerlos y usarlos. Los datos de este siglo son como
el petróleo del siglo XVIII, los datos rasos son como el crudo, y hay que
refinarlos y procesarlos para generar valor. De acuerdo con el reporte de “Digital
Universe” de 2012, únicamente el 3% de la información se encuentra etiquetada,
y solamente la mitad de este % está analizada. Por lo tanto, existen muchos datos
para ser conocidos, extractados y analizados. Y convertidos en Smart Data
CÓMO transformar Big data en Smart data: existen muchas tecnologías que permiten convertir a Smart data, entre ellas “cognitive computing, deep learning, machine learning, artificial intelligence, predictive analytics, graph databases, machine intelligence, voice processing, semantic technologies, autonomous vehicles, Big Data, data science, Internet of Things (IoT), text analysis, Resource Description Framework (RDF), knowledge graphs, contextual computing, Linked Data, deep reasoning, ontologies, JSON-LD, common sense, natural language processing (NLP), and semantic search” (DATAVERSITY, 2017). Todas estas tecnologías están interrelacionadas. Hoy tenemos ejemplos de su uso en varias disciplinas, “IA” es una de las más avanzadas en este siglo.
QUIËN produce y utiliza Smart data: se han realizado esfuerzos en utilizar Big data con las estrategias de Smart data en varias disciplinas, ciencias naturales, ingeniería, análisis financieros, negocios, medicina entre otros. En las humanidades el mundo de Smart data no ha sido universalmente usado, aunque se han realizado proyectos de investigación en estas ciencias. Zeng, presenta un cuadro resumen de actividades y recursos, así como las tecnologías utilizadas en estas actividades de diversas ciencias.
DONDE está la marca distintiva en las humanidades digitales: para Schöch (2013), la marca distintiva de Big data en las humanidades parece ser un cambio metodológico más que una simple tecnología. La visión de convertir Big data en Smart data, nos lleva de vuelta a la conocida pirámide, “Data-Information-Knowledge-Wisdom (DIKW), dato – no sabemos nada, información- el que, conocimiento – el cómo, y Wisdon – el porqué. (Zeleny, 1987; Ackoff, 1988), la cual representa una forma básica de entender el mundo. Sin embargo la aproximación a Smart data no es tan simple como replicar la trayectoria DIKW, puesto que Smart Data está basado en metodologías de Big data, las cuáles nos permiten llegar a conocer “unknown-unknowns”, (Borne 2013) (incógnitas desconocidas),en vez de tomar el camino de “Known-unknown”, (incógnitas conocidas).
CUÁL data se puede encontrar para investigación en Humanidades digitales: al tener Big data y Smart data en un contexto de humanidades digitales un concepto clave que se debe tener claro es el uso de “data”, o los datos. Es importante poder distinguir entre “data” y “digital data”, los cuales no son equivalentes. En las fuentes de datos que existen a través de LAMs, por sus siglas en inglés, “Libraries”, “Archives” y “Museums”, y otras instituciones, así como tipos de datos diversos, en naturaleza, calidad, y los más complejos para procesar, se tienen los datos no-estructurados encontrados en documentos y otros tipos de textos digitalizados o no, y en toda clase de formatos.
En el proceso de transformar datos no-estructurados a datos estructurados o semiestructurados, la estrategia de Smart Data conduce a los proveedores de servicios de datos a llegar a las máquinas entendibles y no solamente las máquinas que leen datos. Esto con el fin de procesar más eficientemente datos para las humanidades digitales. Los datos son la entrada a cualquier investigación y las tecnologías que hoy se tienen soportan análisis complejos de datos no estructurados que son los más comunes en las humanidades.
Las tecnologías avanzadas de hoy bajo Big data y Smart data permiten a los investigadores de las humanidades unirse a la era digital con nuevas habilidades, utilizar grandes volúmenes de datos que tal vez estaban ocultos y a reconstruir el pasado.
Preguntas:
¿Cómo lograr una buena transformación los datos no – estructurados en datos para mi investigación?
¿Cómo determinar las incógnitas desconocidas
en mi investigación y lograr esa transformación de Big data en Smart data que
genere valor para la sociedad?
Referencias
Ackoff, R.L. (1989). From data to wisdom. Journal of Applied Systems Analysis, 16(1), 3–9.
Borne, K. (2013). Big data, small world: Kirk Borne at TEDxGeorgeMasonU [Video file].
Retrieved on December 15, 2016, from https://www.youtube.com/watch?v=Zr02fMBfuRA.
DATAVERSITY Education, LLC. (2017). Smart Data Conference (website). Retrieved on January 12, 2017, from http://smartdata2017.dataversity.net.
Kobielus, J. (2016, June). The evolution of big data to smart data [PowerPoint slides]. Keynote at Smart Data Online 2016.
Schöch, C. (2013). Big? smart? clean? messy? Data in the humanities. Journal of Digital Humanities, 2(3), 2–13.
Zeleny, M. (1987). Management support systems: Towards integrated knowledge management. Human Systems Management, 7(1), 59–70.
Zeng, M. (2017). Smart Data for Digital Humanities, Journal of Data and Information Science, 2(1), 1-12. doi: https://doi.org/10.1515/jdis-2017-0001
Recommend watching the video at https://www.youtube.com/
watch?v=4gIhRkCcD4U).