Analisis de datos: el sector del taxi

Big Data
Etiquetas:

Recientemente, tuve la oportunidad de hablar con un taxista de Madrid, donde se quejaba de las nuevas aplicaciones que les estan dañando el negocio, que están perdiendo clientes, que si esto, que si lo otro, …. quejas, quejas y más quejas.

Mi pregunta cuando terminó fue … ¿pero vosotros teneis algún estudio de Big Data de forma que os pueda ayudar en la toma de decisiones?

Su respuesta fue clara y contundente: no.

Segunda pregunta: o sea, que … ¿el sector del taxi de madrid no recoge la posición de vuestros taxis, tiempos, etc, etc?

Segunda respuesta: no.

Ante mis dos preguntas, surgió la suya: y la recopilación y análisis de datos … ¿que puede suponer? ¿en qué nos podría beneficiar?

Recopilación de datos

El objetivo debe ser:

Para maximizar una jornada laboral en un taxi, lo ideal es tener la “bandera” caida el máximo tiempo posible. Esto no implica más o menos carreras, más largas o más cortas, si no que la bandera esté bajada. Que el tiempo de espera en las paradas sea mínimo.

Y está claro que los datos deben a recopilar serán los datos recogidos en el GPS con el indicador de libre u ocupado.

Quizás, de un solo taxi, los datos no serian una fuente viable, pero …. ¿y si los datos proceden de todos los taxis? ¿y si además, no fuera solo de un día, sino de varios años? La cosa cambia! Y mucho!

Otra información muy valiosa es conocer el número de ocupantes de cada servicio, información que deberá ser introducida por el taxista antes de iniciar la carrera.

Analizando los datos

La primera gran respuesta que hay que analizar es: ¿desde donde se iniciar las carreras?

Entiendo que un gran número se iniciarían desde las paradas oficiales, pero …. ¿acaso no podríamos valorar cuanto es el tiempo medio de espera por parada? Cada vez que llega un taxi a una parada tiene una hora de llegada, y una hora de salida, un día de la semana concreto (laboral, o fin de semana).

Con los datos, se puedo conocer cuál es dicho periodo de “reposo” del taxi. Si encima se pudiera conocer en tiempo real el número de taxis en “espera” en una parada, eso facilitaría la toma de decisiones de un taxista libre: ir a la parada prevista, o ir a otra parada.

También es importante saber qué posibilidades tengo al atravesar cierta vía de que se inicie un servicio. Es más, incluso podría modificarse la ubicación de dichas paradas oficiales si se contrastan los datos.

El análisis de puntos de inicio y final de las carreras puede ser una información muy valiosa, analizada geográficamente. Así, seguro que hay barrios o zonas más propensas que otras respecto al uso del taxi, por días, o incluso por tramos horarios.

El gran objetivo es conocer cómo se mueve la ciudad, para ajustar el sector del taxi a ella.

Acontecimientos puntuales

Con acontecimientos puntuales, me estoy refiriendo a eventos que tengan lugar en un punto concreto de la ciudad que supongan una concentración de gente, por ejemplo, un partido de futbol, un concierto de algún artista famoso, etc, etc.

Estos acontecimientos puntuales son los que hacen “aumentar” (en teoria) el uso del taxi, pero la capacidad de anticiparse a la demanda (con modelos de predicción) supondría una enorme ventaja competitiva, con la posibilidad de gestionar la flota. Por ejemplo, si a un partido de futbol acuden 100.000 espectadores, y está estudiado que el 1% de ellos utiliza el taxi, entonces necesito disponer de 1.000 unidades en las proximidades del mismo sobre la hora de finalización. El flujo de datos de estas carreras, que deben estar marcadas como acontecimiento puntual, servirán para conocer los destinos más probables.

Beneficios del análisis de datos

Seguramente, un sector tan atomizado como el taxi no sea muy consciente de las ventajas colectivas del uso y análisis de datos, pero la realidad es que el beneficio tanto individual como colectivo puede ser muy grande, ofreciendo estrategias a largo plazo, como a corto plazo.

Y un buen ejemplo de análisis de rutas es el siguiente estudio sobre dónde corren los runners en Madrid y Barcelona: http://geospatialtraininges.com/2014/12/09/runners-bigdata-y-gis/.

Desde aquí esta reflexión de cómo el análisis de datos podría mejorar este sector, y del que espero vuestros comentarios.