Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/javi-cc/python-ml-portcanto
Portcanto és un projecte de simulació d'un trajecte en bicicleta. S'ha definit 4 tipus de ciclistes que es diferencien en el temps que tarda a fer el trajecte. L'objectiu és descobrir els 4 patrons amb l'algoritme de clustering KMeans.
https://github.com/javi-cc/python-ml-portcanto
clustering docker docker-compose kmeans machine-learning mlfow pydoc pylint python scikit-learn testing venv
Last synced: about 2 months ago
JSON representation
Portcanto és un projecte de simulació d'un trajecte en bicicleta. S'ha definit 4 tipus de ciclistes que es diferencien en el temps que tarda a fer el trajecte. L'objectiu és descobrir els 4 patrons amb l'algoritme de clustering KMeans.
- Host: GitHub
- URL: https://github.com/javi-cc/python-ml-portcanto
- Owner: JAVI-CC
- License: mit
- Created: 2024-12-05T15:54:39.000Z (about 2 months ago)
- Default Branch: master
- Last Pushed: 2024-12-05T16:23:28.000Z (about 2 months ago)
- Last Synced: 2024-12-05T17:19:50.515Z (about 2 months ago)
- Topics: clustering, docker, docker-compose, kmeans, machine-learning, mlfow, pydoc, pylint, python, scikit-learn, testing, venv
- Language: Python
- Homepage:
- Size: 632 KB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE.txt
Awesome Lists containing this project
README
# Python Machine Learning Portcanto
## Taula de continguts
1. [Portcanto](#portcanto)
2. [Execució](#run)
3. [Docker](#docker)
4. [Clustering](#clustering)
5. [MLflow](#mlflow)
6. [Documentació del codi](#docs)
7. [Anàlisi del codi estàtic](#analisi)
7. [Testing](#tests)
8. [Llicència](#licence)---
### Portcanto
**Portcanto** és un projecte de simulació d'un trajecte en bicicleta. S'ha definit 4 tipus de ciclistes que es diferencien en el temps que tarda a fer el trajecte.L'objectiu és descobrir els 4 patrons amb l'algoritme de clustering KMeans.
Es vol crear dades sintètiques per poder fer un anàlisi de les dades amb IA (bàsicament un problema de clustering).
Consta de dos arxius principals:
- [Generar dataset](generardataset.py): Consisteix a generar diferents dades de cada tipus de ciclista i emmagatzemar totes les dades en un arxiu csv.
- [Cluster ciclistes](clustersciclistes.py): Consisteix principalment a realitzar un anàlisi exploratori de les dades del dataset, generar una imatge per poder visualitzar els diferents clusters, generació d'informes, classificació de noves dades i etc.
Consta també de diferents carpetes i scripts relacionats amb l'anàlisi de les dades i la solució amb IA del problema del clustering.
---
### Execució
Descarregar i ficar-se dins del projecte:
```
$ git clone https://github.com/JAVI-CC/python-ml-portcanto$ cd python-ml-portcanto
```Ara pots crear un entorn virtual fent:
```
$ python -m venv venv
o bé:
$ virtualenv venv$ source venv/bin/activate
```i tot seguit instal·lar els mòduls necessaris:
```
$ pip install --no-cache-dir -r requirements.txt
```Per executar:
```
$ python generardataset.py
``````
$ python clustersciclistes.py
```---
Enllaç del repositori de la imatge: https://hub.docker.com/r/javi98/python-ml-portcanto
#### Contenidors:
* python:3.12 - ```:5000 # Interfície web MLflow```#### Execució:
```
$ git clone https://github.com/JAVI-CC/python-ml-portcanto
$ cd python-ml-portcanto
$ docker compose up -d
$ docker compose exec app python generardataset.py
$ docker compose exec app python clustersciclistes.py
```Una vegada que estigui desplegat el contenidor correctament, per defecte ja es troba arrencat la interfície web de MLflow i pots accedir a la interfície web de MLflow a través de l'url: http://localhost:5000
---
En l'arxiu [clustersciclistes.py](clustersciclistes.py) es resol el problema de trobar els clústers per a les dades simulades.
S'obtenen 4 clústers.
![Clusters](img/grafica1.png)
---
MLflow es tracta d'una plataforma per optimitzar el desenvolupament d'aprenentatge automàtic, que inclou el seguiment d'experiments i l'ús compartit i la implementació de models.
Per generar l'experiment:
(Per defecte ja es troba generat l'experiment.)
```
$ python mlflowtracking-K.py
```Per arrencar la interfície web:
```
$ mlflow ui
```Url per accedir a la interfície web: http://localhost:5000
---
### Documentació del codi
Pots veure la documentació del codi generat dins del directori docs.
* [clustersciclistes.html](docs/clustersciclistes.html)
* [generardataset.html](docs/generardataset.html)Per generar la documentació del codi:
(Per defecte ja es troba generat la documentació del codi.)
```
$ python -m pydoc -w ./generardataset.py
$ python -m pydoc -w ./clustersciclistes.py
o bé:
$ python gendocs.py
```---
Per fer un anàlisi del codi estàtic:
```
$ cd pylint
$ pylint ../generardataset.py
$ pylint ../clustersciclistes.py
```---
Per executar tots els tests del projecte:
```
$ python -m unittest discover -s tests
```---
### Llicència
**JAVI-CC** - IOC (2024)
Llicència MIT. [LICENSE.txt](LICENSE.txt) per més detalls