Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/xrmx/tobikedoc
Descrizione dati recuperabili dal sito tobike.it
https://github.com/xrmx/tobikedoc
Last synced: about 1 month ago
JSON representation
Descrizione dati recuperabili dal sito tobike.it
- Host: GitHub
- URL: https://github.com/xrmx/tobikedoc
- Owner: xrmx
- License: gpl-2.0
- Created: 2014-10-22T12:44:49.000Z (about 10 years ago)
- Default Branch: master
- Last Pushed: 2014-10-23T10:54:16.000Z (about 10 years ago)
- Last Synced: 2024-10-14T12:21:39.657Z (about 1 month ago)
- Language: Python
- Size: 145 KB
- Stars: 1
- Watchers: 2
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# [TO]Bike scraping
## Premessa
[TO]Bike è un servizio di bike sharing disponibile nel Comune di Torino e in
altri comuni limitrofi.Nonostante l'impegno del Comune di Torino verso gli open data i dati delle
stazioni non sono disponibili per terze parti, vedi laconica risposta:```
Gentilissimo,siamo spiacenti ma i dati non sono disponibili per terze parti.
Cordiali saluti
Lo Staff [TO]BIKE
```Per usufruire degli stessi occorre quindi arrangiarsi.
## Come recuperare i dati
Scarichiamo la pagina che contiene le stazioni nel sito per il comune di Torino:
```
wget http://www.tobike.it/frmLeStazioni.aspx
```Fortunatamente tutti i dati delle stazioni sono passati come parametri della funzione RefreshMap:
```
grep -o "{RefreshMap(.*}" frmLeStazioni.aspx | sed 's/{RefreshMap(\(.*\))}/\1/'
```Al termine di questi comandi l'output sarà un file csv di una riga che usa *,* come
separatore dei campi e *'* per fare il quoting delle stringhe.## Descrizione dei dati
Lo stesso dato per tutte le stazioni è raggruppato in un singolo campo. All'interno
dello stesso campo i dati delle singole stazioni sono separati dal carattere *|*.
I campi sono nel seguente ordine:
- id delle stazioni
- numero voti per le stazioni
- media voto per le stazioni
- latitudine delle stazioni
- longitudine delle stazioni
- nomi delle stazioni
- stato biciclette nelle stazioni
- indicazione geografica delle stazioni (con markup html)
- indicazione dello stato della stazione
- il livello di zoom della mappa
- latitudine del Lidl di via Carlo Alberto in Torino (per centrare la mappa)
- longitudine del Lidl di via Carlo Alberto in Torino (per centrare la mappa)Lo stato biciclette delle stazioni è un campo a larghezza fissa di 30 caratteri dove:
- il carattere 0 indica un posto bici vuoto
- il carattere 1 indica una bicicletta non attiva
- il carattere 4 indica una bicicletta disponibile
- il carattere 5 indica una bicicletta non attiva
- le x sono segnapostoPer esempio:
```
40x500000000000xxxxxxxxxxxxxxx
```
indica una bici disponibile, una bicicletta non attiva e dodici posti bici vuoti.Per quanto riguarda lo stato della stazione:
- il carattere 0 indica che non ci sono problemi
- il carattere 2 indica che la stazione non è operativa
- il carattere 3 indica che la stazione è in cantiere
- il carattere 4 indica che la stazione è in fase di definizioneGli stati diverso da 0 indicano che la stazione non è utilizzabile.
## Note
Questo sistema recupera solo i dati della città di Torino. Per recuperare i dati di
tutti i comuni dove funziona il servizio [TO]Bike serve un sistema di scraping più
evoluto.Il progetto [Citybikes](http://citybik.es) offre una [API](http://api.citybik.es/v2/) e il [sorgente](https://github.com/eskerda/PyBike) degli scrapers. Comprende i dati di tutti gli altri comuni del circuito [TO]Bike.
Una implementazione di riferimento in python rilasciata sotto licenza **GPL** è disponibile come *tobike.py*.