En una entrada anterior se enumeraron las 5 premisas de las que consta Big Data, y que son:
- Integrar grandes volúmenes de datos transaccional y de interacción.
- Disponer de datos validados y confiables.
- Proveer capacidades de auto servicio a usuarios, analistas, desarrolladores, data stewards, dueños de proyectos y usuarios de negocio.
- Servicios adaptativos de datos.
- Administración de datos maestros (metadatos).
Vamos a desgranarlas.
Grandes volúmenes de datos
Bid Data implica trabajar con importantes volúmenes de datos, pero a veces, dichos volúmenes puedes ser más o menos abultados dependiendo de la frecuencia con la que se generan dichos datos. Así, si tenemos una pequeño comercio donde contabilizamos todas las ventas que efectuamos, no es lo mismo si se tienen 10 al día, que 10.000. Con el tiempo, habrá una diferencia importante en el volúmen de datos.
¿es tan importante tener grandes volúmenes? Yo creo que cuantos más mejor, pero casi que pondría más énfasis en el segundo requisito: validación de datos,y que éstos sean confiables.
Yo creo que gran parte del éxito de la transformación de datos en información depende de la veracidad de los datos. Evidentemente, más datos mejor!
Sin embargo, el mayor desafío que tiene Big Data es ser capaz de almacenar todos los datos que se generan en cualquier ámbito de nuestro negocio, aunque este aspecto se está solucionando más y más cada día!
Actores de Big Data.
Uno de los aspectos de los que menos se ha hablado es de los distintos actores participantes en Big Data, y que no son pocos.
- El analista debe proporcionar un análisis pormenorizado de la base de datos, de los formatos de datos a insertar, del proceso de inserción, copias de seguridad, preparación de datos y consultas para el análisis estadístico, ….
- El programador debe de “crear” la herramienta con los objetivos previstos por los dueños del negocio, y deben proveer de una interfaz amigable tanto para los usuarios como para la presentación de resultados.
- El estadístico debe proponer hipótesis y valorar los resultados
- …
Por tanto, cada actor requiere datos adaptados a sus necesidades.
Datos de los datos
Es otro de los temas importantes, aunque muchas veces pasan desapercibidos, y es ser conocedor de los metadatos, o datos de los datos: la fuente de origen de datos.
Buen día!