Cómo conseguir los datos de las elecciones del 22 de marzo en Andalucía

Posted by in HTML5, Otros

Una de las incógnitas que siempre he tenido, cada vez que hay unas elecciones es ¿cómo hacen los periódicos online para tener los datos de las votaciones?

Recuerdo que hace tiempo le pregunté a un amigo mio que está bastante metido en política si ellos disponían de bases de datos con las elecciones. Su respuesta fue NO (sorpresa la mia), y que estaban en proceso de obtenerla entre varios compañeros de partido. La conclusión que saqué tras este breve intercambio de email fue que esta información es complicada de conseguir, y si navegas por el Ministerio del Interior, puedes comprobar cómo te lo ponen bastante dificil para extraer la información.

Aun hoy, desconozco el cómo, lo que sí te cuento aquí es cómo los he conseguido yo las votaciones del 22 marzo #EleccionesAndalucia, y siemplemente he tenido que hacer uso de mis pocos conocimientos sobre HTML y Javascript para averiguarlo. La víctima: un sitio muy conocido de prensa española.

El mapa que me dió la clave

Resulta que de pronto, me ví con un mapa de mi querida Andalucía donde representaban de una forma muy agradable la información de las elecciones:

Elecciones 22 Marzo en Andalucía

Elecciones 22 Marzo en Andalucía

Al ver que pasa por un municipio y se actualiza la información, mi primera reacción es que …. la información ha sido cargada durante la carga de la página.

Información de las elecciones 22 marzo 2015

Información de las elecciones 22 marzo 2015

Así que … vamos a investigar qué ha pasado.

Analizando el código HTML

Lo primero que he averiguado es el proveedor de publicidad del medio de información, gracias a la primera librería Javascript que se carga al principio de la página (ante todo, la publicidad que no falte!!). Lo siguiente fue la carga de otra librería de Javascript con la información común y de personalización, dependiendo del idioma (eso está bien, dar a cada uno lo que quiere en su idioma), y otra librería, aun más curiosa, de una empresa que se dedica a la investigación de mercados, cuyo fin es conocer tendencias.

Te dejo aquí lo que pone en su web, para que te hagas una idea de todo lo que sucede antes de que tu veas nada:

XXX es una compañia lider global de marketing  que pone su esfuerzo en el estudiar y reportar las tendencias y comportamientos de internet. Para ello se abastece de toda la información de navegación del navegador, y luego utiliza esos datos en ayudar a conocer cómo es la gente que usa Internet, que le gusta y que no!

En definitiva, que recopilan buena información de tí, lo que te gusta y lo que no! Seguimos!

El siguiente fichero Javascript que carga se hace cargo de informar sobre las cookies, es decir, el rastro de lo que haces (aunque cómo puedes imaginarte, toda esa información ya está en poder de la empresa anterior, incluso si no quieres aceptar cookies).

La siguiente librería de Javascript no he sido capaz de desvelar sus intenciones, pues estaba comprimida y ofuscada (mejor no sepas lo que pasa, je je je!). Y a continuación, se carga la librería de Google AdSense, más anuncios. Tras todo esto, llega el contenido.

El contenido

Cómo puedes ver, el contenido está muy bien estructurado, pero aún no he encontrado lo que busco: la fuente de datos de las elecciones de Andalucía del 22 marzo.

elecciones 2015

elecciones 2015

El siguiente paso es la carga de la infografía, y de las librerías javascript de representación D3, jQuery, y select2 (éstas son básicas hoy día para programación web). A continuación, encuentro lo que busco: el fichero javascript que se encarga de cargar la información (bingo!!!!):

Información de elecciones 22 marzo en Andalucía

Información de elecciones 22 marzo en Andalucía

Ahora sólo queda probar en el navegador dicha ruta, y ya tenemos los datos que están en formato CSV (perfecto, ja ja ja!!).

CSV con los datos de las elecciones 2015 en Andalucía

CSV con los datos de las elecciones 2015 en Andalucía

Además, cómo puedes ver, no solo están los datos de 2015, sino también los de las anteriores elecciones de 2012, así que … me he llevado el doble de información de la que pensaba (ja ja ja!!).

CSV con datos de Elecciones 22 marzo en Andalucía

CSV con datos de Elecciones 22 marzo en Andalucía

El resto de la página HTML está dedicada al pié de página, cuyo contenido no es relevante para nuestras intenciones.

¿Y qué se puede hacer con los datos de las elecciones?

Pues yo, no mucho, porque este pequeño ejercicio lo he realizado más bien por curiosidad que por otra cosa, pero a algún analista político estoy seguro que le haría muchas preguntas.

La información está muy bien preparada y puede ser migrada bastante fácil a una base de datos. Además, una de los mejores datos que incluye es el código oficial INE del municipio, con lo que puede unirse a información administrativa de dicho municipio que se puede encontrar en el INE, para enriquecer aun más las preguntas posibles a responder.

En definitiva, un bonito ejercicio del que además de la información (y por partida doble), me llevo una grata sorpresa con la empresa de representación de datos. Sí es cierto de que sólo disponen de las 6 formaciones políticas más votadas y no incluye ni votos nulos, ni blancos (información que sí viene en la página del Ministerio).

Buen día!

PD: No pongo la fuente porque hay una ley en España que me lo impide! Gracias por leerme.