https://github.com/cquest/retrosirene
Rétrocompatibilité des fichiers SIRENE 2019 -> 2017
https://github.com/cquest/retrosirene
Last synced: 8 months ago
JSON representation
Rétrocompatibilité des fichiers SIRENE 2019 -> 2017
- Host: GitHub
- URL: https://github.com/cquest/retrosirene
- Owner: cquest
- Created: 2018-10-15T07:05:56.000Z (over 7 years ago)
- Default Branch: master
- Last Pushed: 2021-03-17T07:37:31.000Z (about 5 years ago)
- Last Synced: 2025-04-15T22:08:16.125Z (about 1 year ago)
- Language: Shell
- Size: 13.1 MB
- Stars: 5
- Watchers: 3
- Forks: 0
- Open Issues: 2
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# Rétrocompatibilité des fichiers SIRENE 2019 / 2017
Depuis octobre 2018, l'INSEE diffuse les fichiers stock de la base SIRENE avec un nouveau modèle de données.
Ces scripts permettent de regénérer des fichiers stock au plus proche de l'ancien modèle.
## Outils utilisés
- Postgresql (>= 9.5 pour les index BRIN)
- csvkit (https://csvkit.readthedocs.io/en/stable/)
- commandes bash classiques: unzip, zcat, sed
## retrosirene.sh
`./retrosirene.sh `
Ce script charge dans la base Postgresql:
- les nomenclatures d'activité NAP/NAF (1973, 1993, 2003, 2008)
- le Code Officiel Géographique (communes et régions)
- la table d'appartenance des communes à différents zonages (EPCI, Unités Urbaines, etc)
- les libellés de natures juridiques d'entreprises
- la population légale des communes
- les données stock SIRENE selon le nouveau modèle, une fois géocodés
Il créé ensuite une vue "sirene2017" s'approchant au mieux du modèle de donnée de 2017, certains champs n'ayant pas pu être reconstitués.
## Fichiers tests téléchargeables
Les fichiers finaux générés par ces scripts sont téléchargeables sur: http://data.cquest.org/geo_sirene/beta/
Leur contenu évolue encore rapidement au fur et à mesure des améliorations apportées aux scripts.