Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/xrmx/tobikedoc

Descrizione dati recuperabili dal sito tobike.it
https://github.com/xrmx/tobikedoc

Last synced: about 1 month ago
JSON representation

Descrizione dati recuperabili dal sito tobike.it

Awesome Lists containing this project

README

        

# [TO]Bike scraping

## Premessa

[TO]Bike è un servizio di bike sharing disponibile nel Comune di Torino e in
altri comuni limitrofi.

Nonostante l'impegno del Comune di Torino verso gli open data i dati delle
stazioni non sono disponibili per terze parti, vedi laconica risposta:

```
Gentilissimo,

siamo spiacenti ma i dati non sono disponibili per terze parti.

Cordiali saluti

Lo Staff [TO]BIKE
```

Per usufruire degli stessi occorre quindi arrangiarsi.

## Come recuperare i dati

Scarichiamo la pagina che contiene le stazioni nel sito per il comune di Torino:
```
wget http://www.tobike.it/frmLeStazioni.aspx
```

Fortunatamente tutti i dati delle stazioni sono passati come parametri della funzione RefreshMap:
```
grep -o "{RefreshMap(.*}" frmLeStazioni.aspx | sed 's/{RefreshMap(\(.*\))}/\1/'
```

Al termine di questi comandi l'output sarà un file csv di una riga che usa *,* come
separatore dei campi e *'* per fare il quoting delle stringhe.

## Descrizione dei dati

Lo stesso dato per tutte le stazioni è raggruppato in un singolo campo. All'interno
dello stesso campo i dati delle singole stazioni sono separati dal carattere *|*.
I campi sono nel seguente ordine:
- id delle stazioni
- numero voti per le stazioni
- media voto per le stazioni
- latitudine delle stazioni
- longitudine delle stazioni
- nomi delle stazioni
- stato biciclette nelle stazioni
- indicazione geografica delle stazioni (con markup html)
- indicazione dello stato della stazione
- il livello di zoom della mappa
- latitudine del Lidl di via Carlo Alberto in Torino (per centrare la mappa)
- longitudine del Lidl di via Carlo Alberto in Torino (per centrare la mappa)

Lo stato biciclette delle stazioni è un campo a larghezza fissa di 30 caratteri dove:
- il carattere 0 indica un posto bici vuoto
- il carattere 1 indica una bicicletta non attiva
- il carattere 4 indica una bicicletta disponibile
- il carattere 5 indica una bicicletta non attiva
- le x sono segnaposto

Per esempio:
```
40x500000000000xxxxxxxxxxxxxxx
```
indica una bici disponibile, una bicicletta non attiva e dodici posti bici vuoti.

Per quanto riguarda lo stato della stazione:
- il carattere 0 indica che non ci sono problemi
- il carattere 2 indica che la stazione non è operativa
- il carattere 3 indica che la stazione è in cantiere
- il carattere 4 indica che la stazione è in fase di definizione

Gli stati diverso da 0 indicano che la stazione non è utilizzabile.

## Note

Questo sistema recupera solo i dati della città di Torino. Per recuperare i dati di
tutti i comuni dove funziona il servizio [TO]Bike serve un sistema di scraping più
evoluto.

Il progetto [Citybikes](http://citybik.es) offre una [API](http://api.citybik.es/v2/) e il [sorgente](https://github.com/eskerda/PyBike) degli scrapers. Comprende i dati di tutti gli altri comuni del circuito [TO]Bike.

Una implementazione di riferimento in python rilasciata sotto licenza **GPL** è disponibile come *tobike.py*.