https://github.com/inseefrlab/exemples-recensement-parquet
Dépôt pour les codes d'exemples d'utilisation des données du recensement au format parquet
https://github.com/inseefrlab/exemples-recensement-parquet
Last synced: 15 days ago
JSON representation
Dépôt pour les codes d'exemples d'utilisation des données du recensement au format parquet
- Host: GitHub
- URL: https://github.com/inseefrlab/exemples-recensement-parquet
- Owner: InseeFrLab
- Created: 2023-10-18T15:47:30.000Z (over 1 year ago)
- Default Branch: master
- Last Pushed: 2024-01-11T14:42:37.000Z (over 1 year ago)
- Last Synced: 2025-06-12T20:03:58.999Z (15 days ago)
- Language: Lua
- Size: 1.27 MB
- Stars: 9
- Watchers: 4
- Forks: 3
- Open Issues: 1
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# Guide d'utilisation des données du recensement de la population au format `Parquet`
Ce guide présente quelques exemples d'utilisation des données du
recensement de la population diffusées au format `Parquet`.- Exemples `Python`
![]()
- Exemples `R`![]()
- Exemples `Observable Javascript`La version mise en forme au format HTML est disponible
sur
le site web du réseau des data scientists de la
statistique publique ([https://ssphub.netlify.app/post/parquetrp/](https://ssphub.netlify.app/post/parquetrp/)).## Données
Ce dépôt accompagne la mise à disposition des données
du recensement de la population au format `Parquet`
sur le site [insee.fr](https://www.insee.fr/fr/statistiques/7706119?sommaire=7637890).Les pages d'informations sur les données, où sont notamment disponibles
la documentation de celles-ci,
se retrouvent sur le site `insee.fr` aux adresses suivantes:* [Fichier détail individuel](https://www.insee.fr/fr/statistiques/7706119?sommaire=7637890)
* [Fichier détail logement](https://www.insee.fr/fr/statistiques/7705908?sommaire=7637890)Ces pages présentent aussi les données détaillées au format `CSV`. Néanmoins, le format `Parquet`
est plus intéressant pour le traitement de celles-ci. Les données au format `Parquet` sont mises à disposition sur
le site `data.gouv` aux adresses suivantes:* [Fichier détail individuel](https://www.data.gouv.fr/fr/datasets/recensement-de-la-population-fichiers-detail-individus-localises-au-canton-ou-ville-2020-1/)
* [Fichier détail logement](https://www.data.gouv.fr/fr/datasets/recensement-de-la-population-fichiers-detail-individus-localises-au-canton-ou-ville-2020-1/)Ce guide propose d'utiliser [`DuckDB`](https://duckdb.org/) à travers
plusieurs langages pour effectuer des traitements sur les fichiers
détails du recensement.
Par rapport à d'autres approches, [`DuckDB`](https://duckdb.org/) a été choisi pour son efficacité ainsi que pour son universalité.## Contributeurs
Antoine Palazzolo, Lino Galiana, Robin Cura