An open API service indexing awesome lists of open source software.

https://github.com/cquest/retrosirene

Rétrocompatibilité des fichiers SIRENE 2019 -> 2017
https://github.com/cquest/retrosirene

Last synced: 8 months ago
JSON representation

Rétrocompatibilité des fichiers SIRENE 2019 -> 2017

Awesome Lists containing this project

README

          

# Rétrocompatibilité des fichiers SIRENE 2019 / 2017

Depuis octobre 2018, l'INSEE diffuse les fichiers stock de la base SIRENE avec un nouveau modèle de données.

Ces scripts permettent de regénérer des fichiers stock au plus proche de l'ancien modèle.

## Outils utilisés

- Postgresql (>= 9.5 pour les index BRIN)
- csvkit (https://csvkit.readthedocs.io/en/stable/)
- commandes bash classiques: unzip, zcat, sed

## retrosirene.sh

`./retrosirene.sh `

Ce script charge dans la base Postgresql:
- les nomenclatures d'activité NAP/NAF (1973, 1993, 2003, 2008)
- le Code Officiel Géographique (communes et régions)
- la table d'appartenance des communes à différents zonages (EPCI, Unités Urbaines, etc)
- les libellés de natures juridiques d'entreprises
- la population légale des communes
- les données stock SIRENE selon le nouveau modèle, une fois géocodés

Il créé ensuite une vue "sirene2017" s'approchant au mieux du modèle de donnée de 2017, certains champs n'ayant pas pu être reconstitués.

## Fichiers tests téléchargeables

Les fichiers finaux générés par ces scripts sont téléchargeables sur: http://data.cquest.org/geo_sirene/beta/

Leur contenu évolue encore rapidement au fur et à mesure des améliorations apportées aux scripts.