Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/ayaarbi/prediction_des_maladies_cardiovasculaires_avec_ml
Ce projet, développé au sein de cours de Machine Learning, utilise des algorithmes de classification supervisée pour prédire la présence de maladies cardio-vasculaires à partir de données médicales publiées sur Kaggle.
https://github.com/ayaarbi/prediction_des_maladies_cardiovasculaires_avec_ml
cardiovascular-diseases jupyter-notebook machine-learning matplotlib pandas python scikit-learn
Last synced: 2 days ago
JSON representation
Ce projet, développé au sein de cours de Machine Learning, utilise des algorithmes de classification supervisée pour prédire la présence de maladies cardio-vasculaires à partir de données médicales publiées sur Kaggle.
- Host: GitHub
- URL: https://github.com/ayaarbi/prediction_des_maladies_cardiovasculaires_avec_ml
- Owner: ayaarbi
- Created: 2024-11-19T18:51:16.000Z (2 months ago)
- Default Branch: main
- Last Pushed: 2024-11-19T19:48:01.000Z (2 months ago)
- Last Synced: 2024-11-19T19:53:21.589Z (2 months ago)
- Topics: cardiovascular-diseases, jupyter-notebook, machine-learning, matplotlib, pandas, python, scikit-learn
- Language: Jupyter Notebook
- Homepage:
- Size: 6.46 MB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# Classification des Maladies Cardio-vasculaires avec des Algorithmes de Machine Learning
Ce projet explore l'utilisation d'algorithmes d'apprentissage supervisé pour prédire la présence ou l'absence d'une maladie cardio-vasculaire à partir d'un ensemble de données médicales. Il couvre tout le pipeline de machine learning, depuis le prétraitement des données jusqu'à la comparaison des modèles pour sélectionner le meilleur.
Notez bien que ce projet est fait au sein du cours de l'apprentissage automatique pour la première année de cycle des ingénieurs en génie logiciel, afin de mettre en évidence les compétences aqcuises au cours des séances. Des erreurs peuvent être existants.
Le jeu de données 'heart_data.csv' existe sur Kaggle sous le lien: https://www.kaggle.com/datasets/thedevastator/exploring-risk-factors-for-cardiovascular-diseas/data## Contenu du Projet
* Prétraitement des données :
Nettoyage des données, gestion des valeurs manquantes et normalisation des variables pour garantir des entrées cohérentes dans les modèles.* Visualisation des données :
Analyse exploratoire des données (EDA) pour comprendre la distribution des variables et les corrélations importantes à travers des graphiques tels que les histogrammes, les heatmaps et les scatter plots.* Modélisation :
Entraînement et évaluation de plusieurs algorithmes de machine learning, notamment :* Régression Logistique
* K-Nearest Neighbors (KNN)
* Arbre de Décision
* Forêt Aléatoire
* Gradient Boosting Machine (GBM)
* Évaluation et comparaison des modèles :
Utilisation des courbes ROC et des courbes Précision-Rappel, ainsi que des scores d'évaluation tels que l'accuracy, le F1-score, la précision et le rappel pour comparer les modèles et sélectionner le meilleur.* Résultat final :
Le modèle GBM (Gradient Boosting Machine) a été identifié comme le meilleur modèle grâce à ses performances supérieures sur les courbes ROC et Précision-Rappel.## Technologies Utilisées
* Python (pandas, numpy, matplotlib, seaborn, scikit-learn)
* Jupyter Notebook
## Objectif du Projet
Ce projet vise à démontrer comment utiliser des algorithmes de classification dans un cadre supervisé pour résoudre un problème médical critique, avec une mise en œuvre rigoureuse et des analyses détaillées.