Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/kiritoem/ml-journey
Introduction, bases et quelques templates de code avec Python pour comprendre le fonctionnement du Machine Learning
https://github.com/kiritoem/ml-journey
machine-learning python
Last synced: 9 days ago
JSON representation
Introduction, bases et quelques templates de code avec Python pour comprendre le fonctionnement du Machine Learning
- Host: GitHub
- URL: https://github.com/kiritoem/ml-journey
- Owner: KiritoEM
- Created: 2024-10-22T17:13:16.000Z (3 months ago)
- Default Branch: main
- Last Pushed: 2024-10-24T18:10:01.000Z (3 months ago)
- Last Synced: 2024-10-26T14:18:04.548Z (3 months ago)
- Topics: machine-learning, python
- Language: Jupyter Notebook
- Homepage:
- Size: 25.4 KB
- Stars: 8
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: readme.md
Awesome Lists containing this project
README
![Texte alternatif](static/image.png)
## Le Machine Learning, c'est quoi ?
Le Machine Learning, ou apprentissage automatique, est une branche scientifique faisant partie de l'intelligence artificielle, permettant à des algorithmes d'apprendre à partir de données. Cela leur permet de faire des prédictions ou de prendre des décisions sans être explicitement programmés pour chaque tâche.## Que peut-on réaliser avec ?
Nous pouvons citer quelques exemples:
- Prédiction de prix de ventes ou tendances
- Détection de maladies à partir de symptômes
- Recommandation de produits
- Détection de fraude
- Recommandation de films ou animés
- Filtrage de Spam
- Prédiction climatique
- Classification de PDF## Fonctionnement du ML
Le fonctionnement du ML se repose sur 4 étapes clés:
- Collecte des données: rassemblement des datasets pour l'entrainement du modèles (lorsqu'on parle de IA donc on parle de datasets pour l'apprentissage du modèle)
- Préparation des données : nettoyage et transformation des datasets pour les rendre utilisables par l'algorithme, c'est-à-dire, encodage des données d'entrée ou input du modèle, gestion des valeurs manquantes, normalisation des données, conversion des données textuelles en représentations numériques(en matrices et tableaux)
- Séléction du modèle selon les besoins (les types de ML seront cités ci-dessous)
- Entraînement du modèle, évaluation de sa performance et ajustement## Quelques types de d'apprentissage en ML (avec quelques exemples de model accompagné d'illustration dans la réalité)
- Apprentissage supervisé: le model est entraîné sur un ensemble de données étiquetées(réponses connues, chaque valeur cible du datasets est étiquetée)
- Classification : diagnostic médical
- Prédiction: prédiction du prix de vente d'une maison
- Apprentissage non supervisé: le model est entraîné sur un ensemble de données non étiquetées.L'objectif est de découvrir des structures ou des motifs cachés dans les données sans avoir besoin de labels ou de valeurs cibles
- Clustering : segmentation des clients(regroupement des clients en segments selon leur comportements d'achats)
- Apprentissage semi-supervisé: ce type d'apprentissage combine des données étiquetées et non étiquetées pour améliorer la performance du modèles
- Détection de fraudes où seulement quelques transactions sont étiquetées comme frauduleuses.
- Apprentissage par renforcement: le modèle apprend par essais et erreurs en recevant des récompenses en fonction de ses actions:
- gestion de stock en temps réél et le model optimise les commandes en fonction de ventes et niveaux de stocks## Quelques algorithmes couramment utilisé
- Regression linéaire: pour la prédiction de valeurs continues
- K-Nearest Neighbors(KNN): pour la classification et la régression
- Arbre de décision: pour la classification et la régression
- Support Vector Machines(SVM): pour la classification avec des marges maximales
- Random Forest: pour améliorer la précision en combinant plusieurs arbres de décisionOn donnera plus de détails dans les templates (exemple de code pour ces algorithmes)
## Quelques outils et bibliothèques de ML (Lib python)
- Scikit-learn: bibliothèque Python populaire pour les algorithmes classiques de ML
- Pandas et NumPy: pour la manipulation des données
- Matplotlib: bibliothèque Python utilisée our visualisation de la performance du modèle pour l'ajustement et amélioration des modèles## Contributeurs
- [KiritoEM](https://github.com/KiritoEM)
- [HairanRins](https://github.com/HairanRins)