Definición de Big Data

Posted by in Big Data

Últimamente se está hablando mucho de Big Data, pero …

¿Qué es Big Data?

Big Data es el conjunto de procesos de recopilación y análisis de datos en grandes cantidades y muy heterogéneos, tanto en tipología como en procedencia, con unos objetivos. En lenguaje menos estricto, esto es básicamente la conversión de datos en información!!

Sin embargo, los procesos recopilación de datos y análisis son ampliamente conocidos en cualquier proyecto, aunque en mi opinión, no es la parte fundamental en la aplicación de Big Data. Relativo a los objetivos, éstos normalmente tienen que ver con temas empresariales, pero puede ser de otra naturaleza.

Pero … ¿Cuál es la materia prima de Big Data? Pues … está claro, !los datos!

Es cierto que las nuevas tendencias en bases de datos como NoSQL hacen «más fácil» la recopilación de datos en lugar de las tradicionales bases de datos relacionales, y este aspecto puede incidir en nuevas formas de transformar datos en información.

¿Se llama Big Data porque require muchos datos? Más que requerir, es que tiene la característica de analizar muchos datos, dada las nuevas herramientas que están saliendo en los últimos años. Lenguajes como Python, software estadístico como R-project, bases de datos como PostgreSQL, MySQL, mongoDB, …. hacen más fácil el análisis!

Y … ¿que tiene de nuevo Big Data? En realidad…, nada y todo!

Nada, porque no inventa nada nuevo: bases de datos, estadística, programación…. todo eso ya existía antes.

Y todo, porque Big Data requiere aplicar una metodología a los datos combinando todo lo anterior, y cuyo rasgo distintivo debe ser el aspecto cíclico de la metodología. Además de herramientas que permitan el tratamiento de altos volúmenes de datos, volúmenes que «limitan» el uso de las tradicionales sistemas gestores de bases de datos.

Por tanto, aquí en manejandodatos.es hablaremos también de Big Data!

Un saludo.