Desgranando los datos de @BiciMad (2) – Conclusiones iniciales

Cogiendo los datos publicados por datos.madrid.es y opendata.emtmadrid.es, implementé algunas cosas en BiciMadAnalysis – https://github.com/javomorales/BiciMadAnalysis y, a continuación, os presento algunos resultados:

Usos de día

Diapositiva1

Si comparamos datos de uso por horas de dos días laborables con un año de diferencia (27 de septiembre de 2017 y 2018) y un día que hacía mal tiempo (11 de diciembre de 2017), vemos:

  • El uso de @BiciMAD ha aumentado de 2017 a 2018.
  • El uso de @BiciMAD no es constante, sino que se utiliza mucho para desplazarse hacia el centro de trabajo o hacia casa, sobre todo, en las horas punta.
  • El uso de @BiciMAD depende mucho del tiempo que haga, lógicamente, y pasa a utilizarse la mitad cuando el tiempo empeora. Esto implica que más la mitad de los usuarios de @BiciMAD utiliza un medio de transporte alternativo en los días de mal tiempo. Pregunta: si en esos días @BiciMAD costara la mitad, ¿lo utilizarían los mismos usuarios que habitualmente? Con ello, @BiciMAD recaudaría lo mismo que recauda actualmente en los días de mal tiempo, pero conseguiría un importante número de usuarios menos en transportes alternativos, véase coche o @metro_madrid

Edades de Uso

Diapositiva3

El gráfico anterior muestra el uso @BiciMAD diario durante septiembre 2018 por grupos de edad. Muy significativo ver que:

  •  @BiciMAD lo usan mayoritariamente los mayores de 30, es decir, gente con empleo estable.
  • El segundo grupo que más usa @BiciMAD son los mayores de 41.
  • Por último, ver que @BiciMAD es muy poco utilizado por los jóvenes, menores de 27 años.
  • Se observa que el uso de los menores de 27 años es muy homógeneo a lo largo de la semana. Mientras que los mayores de 27, lo usan mayoritariamente en días laborables.

Si observamos el uso de @BiciMAD un mes con mal tiempo, como diciembre de 2017, vemos que el tiempo afecta y mucho en el uso del servicio:

Diapositiva4

Fallos en BiciMad

A continuación podemos ver los usos (azul) y fallos (rojo) de @BiciMAD con datos desde el 1 de abril de 2017.

Diapositiva5

Lo relevante de los datos -> ¿Qué es para mí un fallo y cómo se puede medir?

Al empezar a usar el @BiciMAD seguí los consejos de @mintxy al coger una bici: mira que esté bien en general, frenos, ruedas, sillín, enciende la electricidad, pedalea un poco y mira que la rueda de delante se mueve y que todo va ok.

Pero al hacerme #SúperFanDelBiciMad, me ocurría que a pesar de haber hecho eso, cogía la bici y a la primera pedalada veía que no iba bien, así que la dejaba en la misma estación. Esto es un fallo y se puede medir claramente en los datos proporcionados. ¿Qué saldría? ¿Qué desde hace un año hay más veces que ocurre esto o menos?

Vemos que el uso de @BiciMAD ha mejorado entre septiembre 2017 y septiembre 2018:

Diapositiva6

Con los datos que me proporcionaba opendata.emtmadrid.es de @EMTmadrid pude comparar los fallos, es decir, las veces que se dejaba una bicicleta en la misma estación de la que se desanclaba en un mismo momento y éste es el resultado:

Diapositiva7

CONCLUSIÓN: El uso de @BiciMAD ha aumentado entre septiembre 2017 y 2018 y los fallos han bajado a casi la mitad. Lo que demuestra, que el servicio de mantenimiento de @BiciMAD ha mejorado considerablemente.

Eso no quita, para tener margen de mejora. Pero eso queda para otro post.

Desgranando los datos de @BiciMad (1)

Me he vuelto tan #SúperFanDelBiciMad y vi el gran esfuerzo que están haciendo con datos.madrid.es y opendata.emtmadrid.es, que me lié la manta a la cabeza y me puse a estudiar lo que publican.

Mucho de recordar Ruby, un poco de aprender JSON y algo de leer a @rameerez (github.com/rameerez/bicimad-data-analysis) que me entraron unas ganas locas de intentar sacar  información útil.

El desarrollo lo tenéis aquí -> BiciMadAnalysis – https://github.com/javomorales/BiciMadAnalysis

Los análisis implementados a día de hoy son:

  1. Todo -> Un subconjunto de datos de cada uso del BiciMad: unplug_hourTime – user_day_code idunplug_station – idplug_station – idunplug_base – idplug_base – user_type – travel_time – ageRange – zip_code.
  2. Usos Día -> Usos de BiciMad en un día concreto, por horas.
  3. Usos Mes -> Usos de BiciMad en un mes concreto.
  4. Edades Uso -> Edades de uso del BiciMad.
  5. Fallos Bicis -> Fallos que ha tenido el BiciMad, por las bicis que se cogen y se devuelven en la misma estación.

Lo que queda por hacer – ToDos:

  • Analizar las estaciones más utilizadas.
  • Analizar las vías más transitadas (con Carto).
  • Un grafo (Gephi) de los tránsitos más utilizados de 7 a 10 y de 15 a 19.
  • Subir datos a PowerBI.

¿Qué resultados he obtenido del análisis?

Aunque en el repositorio de Github se puede intuir, pronto os contaré los resultados obtenidos, algunos bastante interesantes.