Manejando datos

Python y BeautifulSoup: extrayendo resultados de LiveScore

Posted by in Python

Esta entrada de hoy es una sugerencia de un lector de este blog, y al igual que yo, interesado en el mundo del fútbol y las quinielas. Concretamente, se trata de recuperar la información de los partidos de la web de LiveScore.com. Utilizando un fichero de configuración Para facilitar la personalización, vamos a crear un fichero ini, donde pondremos una clave, y la URL, por ejemplo: [livescore] champ=http://www.livescore.com/soccer/champions-league/ spain=http://livescore.com/spain Aquí hemos puesto solo 2 enlaces, pero puedes poner uno, o más de uno pues se procesan todas las URLs que…read more

Python y BeautifulSoup: resultados de los partidos de la liga de fútbol española

Posted by in Python

Nuevo capítulo de web scrapping, y esta vez queremos recuperar los marcadores de los partidos de futbol de primera y/o segunda división de la Liga de fútbol Profesional de España. Para ello, preparamos una rutina para que pregunte división, y jornada. El resultado es este: Ya tenemos los 2 datos que necesitamos. Ahora, le restamos uno a la división puesto que tenemos una lista con las dos URLs, una para cada división (y que son esta y esta). Usando lo que ya vimos en la entrada sobre extraer códigos HTML…read more

0

Python y BeautifulSoup: Extraer escrutinio de la quiniela

Posted by in Python

En esta entrada voy a exponer cómo he resuelto un problema para automatizar más algunas partes de mi software de Fútbol. He utilizado Python., junto con BeautifulSoap, con el fin de extraer toda la información sobre los escrutinios de la quiniela, esto es, lo que cobran los acertantes, recaudación y bote de la quiniela. En la entrada anterior vimos cómo instalarlo, y qué podemos hacer con él, pero ahora vamos a aplicarlo para solventar una cuestión concreta. El objetivo a extraer El contenido a extraer es el marcado en el…read more

0

Las 5 premisas de Big Data

Posted by in Big Data

Implícito en la definición de Big Data queda el que estamos tratando con grandes volúmenes de datos (o no, cómo también veremos con el Small Data). Para las organizaciones supone todo un desafío enfrentarse al problema de reparto de la información por toda la estructura de la empresa, incluso en lugares físicos distantes. Si con eso no bastara, los datos provienen de diversas fuentes, muchas de ellas desestructuradas. Como respuesta a este desafío, aquí se exponen las cinco premisas de Big Data: Integrar grandes volúmenes de datos transaccional y de…read more