https://github.com/jeremiegince/mlintroduction

Exercice d'introduction à l'apprentissage machine.
https://github.com/jeremiegince/mlintroduction

francais machine-learning python tutorial

Last synced: 17 days ago
JSON representation

Exercice d'introduction à l'apprentissage machine.

Host: GitHub
URL: https://github.com/jeremiegince/mlintroduction
Owner: JeremieGince
License: apache-2.0
Created: 2022-03-06T02:16:02.000Z (over 3 years ago)
Default Branch: main
Last Pushed: 2022-03-08T16:53:32.000Z (over 3 years ago)
Last Synced: 2025-09-23T03:48:12.973Z (17 days ago)
Topics: francais, machine-learning, python, tutorial
Language: Jupyter Notebook
Homepage:
Size: 2.65 MB
Stars: 0
Watchers: 1
Forks: 1
Open Issues: 0
Metadata Files:
- Readme: README.md
- License: LICENSE

Awesome Lists containing this project

README

# MLIntroduction

---------------------------------------------------------------------------
Exercice d'introduction à l'apprentissage machine.

## Instructions:
1. Dans un premier temps, vous devez adapter le code de "knn_iris.ipynb" pour entraîner un perceptron de sklearn sur le
dataset de Iris. On vous suggère de comparer les performances des deux algorithmes. Votre implémentation sera fait
dans le fichier "exercice/sklearn/perceptron_iris.py".
2. Ensuite, vous allez devoir implémenter un K-NN avec seulement le package numpy à votre disposition dans le fichier
"exercice/from_scratch/knn.py". Faite vous un objet KNN ayant les méthodes suivantes qui sont basé sur le template
de sklearn:
1. ```fit(X: np.ndarray, y: np.ndarray) -> None```
2. ```predict(self, X: np.ndarray, y: Optional[np.ndarray] = None) -> np.ndarray```
3. Refaite le même exercice, mais avec le perceptron dans le fichier "exercice/from_scratch/perceptron.py".
4. Finalement, vous pouvez comparer les résultats des algorithmes en les entraînant sur le dataset
[digits](https://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_digits.html) de sklearn.
la fonction suivante vous sera utile pour downloader le dataset
```X, y = datasets.load_digits(return_X_y=True)```.
1. Vous aurez à calculer la [matrice de confusion](https://en.wikipedia.org/wiki/Confusion_matrix) de la
classification des classifications. Afficher les sous forme de heatmap ou d'image afin de pouvoir les visualiser.
2. De plus, calculer les [métriques](https://en.wikipedia.org/wiki/Precision_and_recall) suivantes pour chaque
classifieur:
1. Accuracy
2. Recall
3. F1Score

Ces métriques doivent être calculée sur votre ensemble de test pour être en mesure de savoir si vous avez
underfit ou overfit vos données d'apprentissages. La fonction suivante de sklearn vous sera utile:
- ```sklearn.model_selection.train_test_split```
- ```X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.33, random_state=42)```.

## Setup

- Cloner le répertoire présent.
- Créer votre environnement virtuel pour ces exercices.
- Installer les dépendances avec
- ```pip install -r requirements.txt```

## Références
- Pour plus d'information sur comment utiliser git:
- [TutorielPython-Manuel/git](https://github.com/JeremieGince/TutorielPython-Manuel/tree/master/Cycle-de-developpement-avec-git)
- Pour plus d'information sur comment créer un environnement virtuel:
- [TutorielPython-Manuel/Environments](https://github.com/JeremieGince/TutorielPython-Manuel/tree/master/Environments)
- Si vous désirez avoir des ressources au niveau de l'affichage avec python:
- [Atelier de visualisation du ProgFest](https://github.com/rem657/AtelierVisualisation)

## Solution
La solution est fournie dans le dossier './solution'.

---------------------------------------------------------------------------

ecosyste.ms

Data

Tools

Indexes

Applications

Experiments

Awesome

https://github.com/jeremiegince/mlintroduction

Awesome Lists containing this project

README