En una entrada anterior ya se describió que es Big Data. Ahora entramos con más detalle en la “sustancia”, que no es poca!
La primera vez que escuché hablar de Big Data fue gracias a un Tweet retuiteado, donde se enlazaba al libro “Planning for big data“, y que podeis encontrar aquí en inglés (muy recomendable!!). La curiosidad quiso que leyera el primer capítulo ….
“Un piloto de combate describió una metodología de combate basada en su experiencia, y que consistía en 4 pasos:
- Observar.
- Orientar.
- Decidir.
- Actuar en consecuencia, volviendo al principio.
El lo que se llama metodología OODA. Sin embargo, la parte más importante de las 4 anteriores no es ninguna de dichas siglas del acrónimo, sino el echo de que sea cíclico!”
Realmente, el hecho de que dicho proceso sea cíclico hace que las nuevas decisiones sean tomadas según lo acontenido anteriormente, pero para ello hay que tener en cuenta un aspecto decisivo: la posibilidad de captura de datos, y del análisis de los mismos, de forma que dichos datos sean transformados en información, permitiendo incorporar nuevos datos para las siguientes.
Para poder implementar la metodología se necesita:
- Hardware, que es la máquina (o las máquinas) donde se almacena y se ejecuta el procedimiento
- Base de datos, que es donde se almacenan los datos
- Software de análisis, que sea capaz de transformar los datos en información
Respecto al hardware, sus requisitos están vinculados a las necesidades de almacenamiento y a la capacidad de procesamiento. No es lo mismo tener que procesar datos que se generar a 1 Gb diario, que cuando es 1 Gb al mes. Aquí no me voy a meter mucho pues no es mi especialidad.
Respecto a la base de datos, actualmente se ha “roto” la tendencia de bases de datos relacionales y hay otros tipos de bases de datos. La naturaleza de los datos a recolectar hará que el analista se decante por una u otra dependiendo de los datos y la estructura de los mismos.
Y por último, respecto al software de análisis, éste es el que tiene que aportar la transformación de datos en información, de la forma más rápida y óptima posible, facilitando el aspecto cíclico. El software depende mucho del objetivo a alcanzar, de los datos a recopilar, de la inversión económica a realizar, ….
En próximas entradas os comentaré sobre mi software de quinielas, que justo aplica esta metodología sin yo ser consciente de ello!! (Bueno, ahora sí lo doy, y lo estoy mejorando!).
Un saludo.