Manejando datos

Obtener el código HTML de una página web en Python y C#

Posted by in c#, Python

Vamos a realizar un pequeño ejercicio de Python, que consiste en extraer el código fuente de un sitio web. El código Python lo teneis en GitHub. Código en Python Para ello requerimos usar urllib2: El resultado no es sino el código HTML de la url: Hemos conseguido nuestro objetivo, que era recuperar el código fuente HTML de una página. Si deseamos extraer información, habrá que trabajar con otros paquetes y librerías, aunque eso lo dejaremos para otra entrada. Ahora, en C# Para realizar exáctamente lo mismo en C#, necesitamos de…read more

Small Data

Posted by in Big Data

Mucho se está hablando de la importancia de Big Data y de lo complejo que es, etc, etc … Pero ¿y si no tenemos tantos datos? o dicho de otro modo ¿y si analizamos los datos desde otra perspectiva? Les propongo que inviertan unos minutos en la siguiente entrada (http://pandodaily.com/2013/09/18/big-data-does-size-really-matter/?goback=.gde_4762568_member_275234744#!), pues describe perfectamente cómo utilizar la información, la importancia de la recopilación de datos y su tratamiento: Big Data no tiene importancia, salvo que sepas cómo utilizarla Big Data y Small Data Big Data trata de definir el comportamiento de…read more

Qué es el análisis de datos

Posted by in Big Data

La definición, sacada de la Wikipedia es: El análisis de datos es un proceso de inspeccionar, limpiar y transformar datos con el objetivo de resaltar información útil, lo que sugiere conclusiones, y apoyo a la toma de decisiones. El análisis de datos tiene múltiples facetas y enfoques, que abarca diversas técnicas en una variedad de nombres, en diferentes negocios, la ciencia, y los dominios de las ciencias sociales. Básicamente, la materia que posibilita el que se pueda realizar análisis de datos es … la existencia de datos. He querido remarcar…read more

Los actores de Big Data

Posted by in Big Data

Un aspecto al que aún no hemos dedicado prácticamente tiempo, pero que es pieza fundamental, es los actores que intervienen en el desarrollo de #BigData. En mi caso concreto, y sobre el software de quinielas que llevo desarrollando durante más de 10 años, yo soy el analista, programador, estadístico, apostador, …. Más de uno se preguntará que no habrá tantos datos que analizar en las quinielas, aunque yo contaré los que necesito, los que genero, los análisis que hago, y algunas decisiones que tomo! Mi software «parece» simple, pero, ……read more

Cuatro realidades de Big Data

Posted by in Big Data

Tomando como base este artículo, enumero las 4 realidades de Big Data que hay que tener en cuenta, en mi opinión. Big Data requiere una cultura diferente, en la empresa y de los empleados Para conocer todo de tu empresa, es fundamental que la mentalidad de todo el personal cambie, estando centrado en los datos, y TODOS los datos deben almacenarse, analizarse y procesarse. El aspecto más decisivo en Big Data es la mentalidad de la gente, y esto es clave para que la aplicación de la metodología Big Data…read more