https://github.com/cquest/geocodage-spd
Scripts de géocodage et remise en forme des bases du Service Public de la Donnéee
https://github.com/cquest/geocodage-spd
adresse geo sirene
Last synced: about 1 year ago
JSON representation
Scripts de géocodage et remise en forme des bases du Service Public de la Donnéee
- Host: GitHub
- URL: https://github.com/cquest/geocodage-spd
- Owner: cquest
- License: agpl-3.0
- Created: 2016-11-11T17:29:00.000Z (over 9 years ago)
- Default Branch: master
- Last Pushed: 2023-05-09T13:37:01.000Z (about 3 years ago)
- Last Synced: 2025-04-15T22:09:15.744Z (about 1 year ago)
- Topics: adresse, geo, sirene
- Language: Python
- Homepage:
- Size: 885 KB
- Stars: 69
- Watchers: 10
- Forks: 19
- Open Issues: 12
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# Scripts de géocodage des données du Service Public de la Donnée
Ces scripts s'appuient sur le moteur de géocodage addok développé par Etalab.
Pour obtenir une couverture maximale, deux instances d'addok sont utilisés, l'une s'appuyant sur la BAN (Base Adresse Nationale) elle même faisant partie du Service Public de la Donnée, la seconde sur la BANO (produite par OpenStreetMap France) afin de compléter la BAN en particulier sur les localisations des lieux-dits.
Pour accélérer le géocodage et tirer parti des multiples coeurs disponibles dans nos machines, le fichier national est découpé par département et chaque fichier départemental est géocodé en paralèlle.
Un script python assure le double géocodage et détermine la meilleure réponse. Il tente aussi de géocoder les différentes adresses et variantes des adresses présentes dans les fichiers d'origine.
Ce script est exécuté en paralèlle à l'aide de la commande GNU parallel.
## SIRENE
[A propos du géocodage de la base SIRENE](insee-sirene/README.md)
## RNA
[A propos du géocodage du RNA](rna/README.md)