https://github.com/walidoux/data-analysis
https://github.com/walidoux/data-analysis
Last synced: about 1 year ago
JSON representation
- Host: GitHub
- URL: https://github.com/walidoux/data-analysis
- Owner: Walidoux
- Created: 2025-03-05T01:07:57.000Z (about 1 year ago)
- Default Branch: master
- Last Pushed: 2025-03-05T17:42:18.000Z (about 1 year ago)
- Last Synced: 2025-03-05T18:41:24.975Z (about 1 year ago)
- Language: Python
- Size: 2.93 KB
- Stars: 1
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# Hellow
Le rapport final est présenté sur [ce lien](https://walid-projects.notion.site/Projet-ADD-1a529a68f59c805a9e5fcb06292dff3e)
Temps passé sur le projet : +50h
IDE utilisé : Visual Studio Code
EOL Sequence : LF
## Installation
```bash
pip install snakemd
```
### Roadmap
- [x] Codification de chaque variable + Documenter le processus
- [ ] (Diapo 6 et 12) Afficher comme statistique les formats erronés/dupliqués/incohérentes/extrêmes
- [ ] (Diapo 13) Générer un tabeleau "Vue des variables" comme partie de la documentation
- [x] (Diapo 17) Identifier les données manquantes + Documenter en créant un tableau statistiques avec toutes les variables et un tableau avec tout ces détails pour chaque variable
- [x] (Diapo 18) Par défaut, ignorer les valeurs manquantes. Si ces dernières constituent un taux entre 30% et 40%, il faudra supprimer la variable concernée si seulement le pourcentage des données manquantes est faible (15%) et réparti aléatoirement. Sinon si aucune de ces conditions ne sont satisfaites
- [ ] (Diapo 22) Ajouter l'imputation multiple, médianne ou Mode
- [ ] (Diapo 24) Ajouter un tableau "Variables de résultat" après remplaçage des données manquantes
- [ ] (Diapo 26) Imputation avancée au niveau du traitement des données manquantes
- [ ] Régression linéaire
- [ ] Imputation multiple
- [-] (Diapo 28) Transformation ou permutation des villes par division limitrophe du continent africain