https://github.com/nullndr/scraperparlamentari
ScraperParlamentari estrae i dati dei senatori e deputati della repubblica italiana
https://github.com/nullndr/scraperparlamentari
Last synced: 11 months ago
JSON representation
ScraperParlamentari estrae i dati dei senatori e deputati della repubblica italiana
- Host: GitHub
- URL: https://github.com/nullndr/scraperparlamentari
- Owner: nullndr
- License: gpl-3.0
- Created: 2022-09-08T15:37:43.000Z (almost 4 years ago)
- Default Branch: main
- Last Pushed: 2022-09-17T10:34:15.000Z (almost 4 years ago)
- Last Synced: 2025-06-19T01:37:26.476Z (12 months ago)
- Language: Python
- Homepage:
- Size: 41 KB
- Stars: 3
- Watchers: 1
- Forks: 1
- Open Issues: 1
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# Web scraper per deputati e senatori della repubblica italiana
## Setup
Installa le dipendenze python con:
```bash
$ pip install -r requirements.txt
```
## Avvio
Esegui:
```bash
$ python main.py
```
Per lanciare lo scraper.
Lo script `main.py` crea, nella sua stessa cartella, il file `deputati.csv`, che contiene, separati da virgole e in questo ordine:
- id del deputato (numero di 5 o 6 cifre)
- COGNOME (tutti in maiuscolo)
- Nome (con le iniziali maiuscole)
- indirizzo e-mail @camera.it
Tali dati sono estratti da https://www.camera.it/leg18/28 e dalle pagine personali dei deputati agli indirizzi https://scrivi.camera.it/scrivi?dest=deputato&id_aul=id dove id è l'id del deputato di cui sopra.
## Docker
Nella repo sono presenti il file `Dockefile` e `docker-compose.yaml` per avviare docker e compose.
```bash
$ docker compose up -d
```
> ⚠️ In base alla versione di `docker` in uso è forse necessario usare il comando `docker-compose up -d`
Con il container in esecuzione è possibile controllare lo stato di avvanzamento con:
```bash
$ docker attach scraper
```