Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/renanholler/ml-clustering-classification
Implementação do projeto da disciplina 65PIN3 – Projeto Integrador III, oferecida pelo curso de Engenharia de Software da Universidade do Estado de Santa Catarina (UDESC).
https://github.com/renanholler/ml-clustering-classification
classification clustering machine-learning python
Last synced: 8 days ago
JSON representation
Implementação do projeto da disciplina 65PIN3 – Projeto Integrador III, oferecida pelo curso de Engenharia de Software da Universidade do Estado de Santa Catarina (UDESC).
- Host: GitHub
- URL: https://github.com/renanholler/ml-clustering-classification
- Owner: renanholler
- Created: 2024-08-09T00:18:09.000Z (3 months ago)
- Default Branch: main
- Last Pushed: 2024-08-09T00:37:33.000Z (3 months ago)
- Last Synced: 2024-08-09T02:01:13.447Z (3 months ago)
- Topics: classification, clustering, machine-learning, python
- Homepage:
- Size: 4.88 KB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# ML-Clustering-Classification
A tarefa consiste na aplicação de técnicas de agrupamento e classificação de frutas com base em um conjunto de dados fornecido pela empresa fictícia "Grupo Flora", que é especializada na exportação de frutas.## Descrição do Projeto
O objetivo principal desta tarefa era utilizar técnicas de agrupamento e classificação para analisar um conjunto de dados de frutas, sendo:
1. **Agrupamento de Frutas**: Utilização de um algoritmo de clustering para agrupar frutas com base em suas características.
2. **Classificação de Frutas**: Treinamento de um modelo de classificação usando os grupos formados pelo algoritmo de clustering como uma das variáveis.## Metodologia
### Agrupamento
Para o agrupamento, foi utilizado o algoritmo K-Means, que é um método amplamente conhecido e eficiente para particionar dados em k grupos baseados em características comuns. A escolha do número de clusters foi determinada usando o método do cotovelo (Elbow Method).
### Classificação
Após o agrupamento, utilizou-se o algoritmo Random Forest para realizar a classificação das frutas. O modelo foi treinado utilizando os grupos formados como uma das variáveis de entrada, além das características originais das frutas.
### Avaliação
A avaliação do modelo foi realizada utilizando uma bateria de testes, com métricas como acurácia, precisão, recall e F1-score para medir o desempenho dos modelos de classificação. Para o agrupamento, foram utilizadas métricas como a inércia (no caso do K-Means) e a silhueta para avaliar a qualidade dos clusters formados.