Manejando datos

Trabajando con BeautifulSoup en Python

Posted by in Python

En esta entrada voy a exponer cómo extraer información de una Web, utilizando Python. Empezamos por la instalación, y a continuación, un sencillo ejemplo. Instalando BeautifulSoup Para trabajar con HTML, una de las opciones más interesantes es BeautifulSoup, así que … vamos a instalarlo. Puedes comprobar que con pip no he sido capaz de instalarlo, mientras que se ha instalado correctamente con easy_install. Ahora confirmamos que funciona. NOTA: No voy a hacer un tutorial sobre BeautifulSoap, sino cómo utilizar esta librería para solventar un problema concreto! Haciendo pruebas con BeautifulSoup…read more

0

Cursos en Febrero 2014

Posted by in Cursos

En esta breve entrada os facilito algunos cuantos cursos que pueden ser de mucho interés para vosotros, y que comienzan en breve. El primer lugar, uno de programación en #Python, cuya información teneis aquí: https://www.edx.org/course/harvardx/harvardx-cs50x-introduction-computer-1022#.U3NF9XbTmHM. Comienza el 19 de Febrero, y son 9 semanas. Está indicado para aquellos que se quieran iniciar, o que lleven poco tiempo y quieran afianzar más sus conocimientos. Si te decantas por el tema de análisis de datos, aqí tienes otra buena opción, que empieza el 17 de Febrero en coursera: www.coursera.org/course/statistics. Este curso está…read more

0

Trabajando con ficheros de configuración en Python: ConfigParser mejorado

Posted by in Python

Cómo pudisteis leer en mi anterior entrada sobre Python y ConfigParser, a pesar de su efectividad, algunas cosas de esta librería no son precísamente “directas”. Así que … estuve investigando si alguien tenía alguna clase mejorada de ConfigParser. En la primera búsqueda realizada encontré esta entrada (http://www.decalage.info/en/python/configparser), y encontré una clase mejorada para lectura (no para escritura) entre los comentarios. Rebuscando más, encontré un proyecto en Python con una clase mejorada muy potente, aunque altamente personalizada para dicho proyecto: , e incapaz de usar nada, fundamentalmente porque es específica para…read more

Trabajando con ficheros de configuración en Python: ConfigParser

Posted by in Python

Quizás sea de los priméros módulos de Python que se me ha atravesado un poco. Básicamente, los ficheros de configuración (en Windows sin los clásicos ficheros .ini) son aquellos donde se almacena información que es utilizada por el software de una ejecución a la siguiente. Yo soy de los que siempre he utilizado ficheros INI, y quizás, de las primeras cosas que suelo aprender (programación más avanzada). Pythoneando en VB6 Recientemente tuve un problema con una librería que solía utilizar en VB6, así que decidí modificarla entera. Inconscientemente estaba utilizando…read more

Obtener el código HTML de una página web en Python y C#

Posted by in c#, Python

Vamos a realizar un pequeño ejercicio de Python, que consiste en extraer el código fuente de un sitio web. El código Python lo teneis en GitHub. Código en Python Para ello requerimos usar urllib2: El resultado no es sino el código HTML de la url: Hemos conseguido nuestro objetivo, que era recuperar el código fuente HTML de una página. Si deseamos extraer información, habrá que trabajar con otros paquetes y librerías, aunque eso lo dejaremos para otra entrada. Ahora, en C# Para realizar exáctamente lo mismo en C#, necesitamos de…read more

Página 40 de 65« Primera...102030...3839404142...5060...Última »