https://github.com/walidkorchi/data-analysis
đ Projet universitaire d'analyse des donnĂ©es Ă l'ENCG
https://github.com/walidkorchi/data-analysis
analysis data encg science statistics
Last synced: about 7 hours ago
JSON representation
đ Projet universitaire d'analyse des donnĂ©es Ă l'ENCG
- Host: GitHub
- URL: https://github.com/walidkorchi/data-analysis
- Owner: walidkorchi
- Created: 2025-03-05T01:07:57.000Z (over 1 year ago)
- Default Branch: master
- Last Pushed: 2025-04-29T22:51:27.000Z (about 1 year ago)
- Last Synced: 2026-01-17T15:21:50.514Z (5 months ago)
- Topics: analysis, data, encg, science, statistics
- Language: Python
- Homepage: https://walid-projects.notion.site/Projet-ADD-1a529a68f59c805a9e5fcb06292dff3e
- Size: 10 MB
- Stars: 1
- Watchers: 0
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
> [!NOTE]
> Ce projet tente de traiter, nettoyer, structurer et analyser statistiquement une base de données issue d'un questionnaire rempli par des étudiants en troisiÚme année pré-master de l'[ENCGD](https://encgd.uiz.ac.ma/).
Un rapport final de ce projet est consultable via [ce lien](https://walid-projects.notion.site/Projet-ADD-1a529a68f59c805a9e5fcb06292dff3e). Vous trouverez tout les détails et explications à la réalisation de ce projet.
- [Spécificités](#spécificités)
- [Méthodes utilisées](#méthodes-utilisées)
- [Détails](#détails)
- [Usage](#usage)
- [Installation](#installation)
- [Post-installation](#post-installation)
- [Exécution](#exécution)
- [Arguments (paramĂštres)](#arguments-paramĂštres)
## Spécificités
### Méthodes utilisées
- Régression linéaire : Utilisé pour prédire et substituer les valeurs inconnues/invalides par des approximaions équivalentes
- Tests statistiques : Test de Khi-Deux, test t pour échantillon unique/indépendant, ANOVA à 1 facteur
- Représentations graphiques : Histogrammes, diagrammes, choroplÚthe, boxplots, matrice de corrélation.
### Détails
- Début officiel du projet : 05 Mars 2025
- Temps moyennement investi : +200h
## Usage
Toutes contributions sont la bienvenues, vous devez en premier lieu :
### Installation
Installer Python 3.13.x sur votre machine, si vous ĂȘtes sur Windows ou MacOS, redirigez-vous sur [le site officiel](https://www.python.org/downloads), tĂ©lĂ©chargez le directement et exĂ©cuter le fichier `.exe` si Windows, sinon `.pkg` pour MacOS. Si vous ĂȘtes sous Linux, vous pouvez suivre la mĂȘme Ă©tape mais il est prĂ©fĂ©rable d'utiliser le gestionnaire de packets (packet manager) selon votre distribution :
```bash
# Debian/Ubuntu
sudo apt update
sudo apt install python3 python3-pip
# Fedora
sudo dnf install python3 python3-pip
# Arch Linux
sudo pacman -S python python-pip
```
### Post-installation
Ce projet utilise des librairies externes que vous devez télécharger en exécutant la ligne de commande suivante selon votre systÚme d'exploitation :
```bash
# Windows
pip install -r requirements.txt
# Linux
python3 -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt
```
### Exécution
Par défaut, ce programme génére trois documentations, [`DOCS.md`](./markdown/DOCS.md) avec une vue d'ensemble des variables de la base de donnée ainsi que des informations complémentaires. Il génére pour chaque variable des tableaux représentatifs des valeurs lors du traitement des données sur [`DATA.md`](./markdown/DATA.md). Il génére aussi pour chaque variable des statistiques descriptives sur [`STATS`](./markdown/STATS.md)
Ce programme génére aussi des images pour visualiser les données traitées et référencées sur les documentations.
Voici la ligne de commande génératrice de tout ceci :
```bash
py.exe .\analysis.py # Windows
python3 ./analysis.py # Linux/MacOS
```
### Arguments (paramĂštres)
- `--write="NONE"` : Ajouter cet argument permet de spécifier sur quel type de fichier écrire la documentation générée à l'exécution du programme qui peut prend les valeurs correpondant aux noms des fichiers sur le dossier [markdown ici](./markdown). `NONE` veut dire aucune écriture. Vous pouvez spécifier plusieurs types de fichiers en séparant par une virgule.
- `--skip-geolocation` : Ignorer l'étape de génénaration de la carte choroplÚthe. Le service externe de géolocalisation des villes prend beaucoup de temps à s'exécuter.
- `--skip-visualization` : Ignorer l'étape de génération des représentations graphiques.