https://github.com/benzerinsio/floralspecies-eda
📊 Análise Exploratória de Dados (EDA) - Flores Iris | Exploração de padrões e clustering com K-Means
https://github.com/benzerinsio/floralspecies-eda
analise-de-dados analise-exploratoria analise-exploratoria-de-dados botany clustering data-visualization eda exploratory-analysis exploratory-data-analysis python seaborn
Last synced: about 2 months ago
JSON representation
📊 Análise Exploratória de Dados (EDA) - Flores Iris | Exploração de padrões e clustering com K-Means
- Host: GitHub
- URL: https://github.com/benzerinsio/floralspecies-eda
- Owner: benzerinsio
- Created: 2025-02-25T14:16:05.000Z (3 months ago)
- Default Branch: main
- Last Pushed: 2025-03-11T01:56:04.000Z (2 months ago)
- Last Synced: 2025-03-11T02:37:56.619Z (2 months ago)
- Topics: analise-de-dados, analise-exploratoria, analise-exploratoria-de-dados, botany, clustering, data-visualization, eda, exploratory-analysis, exploratory-data-analysis, python, seaborn
- Language: Jupyter Notebook
- Homepage:
- Size: 2.47 MB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# 🪷 Espécies de Flores Iris
*Projeto de Análise Exploratória de Dados (EDA) - Felipe V. Sousa*Bem-vindo(a)! Este repositório apresenta uma **Análise Exploratória de Dados (EDA)** no conjunto de dados das flores Iris, explorando padrões e aplicando clustering para estimar o número de espécies.
🔗 [Visualizar o Notebook](https://github.com/benzerinsio/FloralSpecies-EDA/blob/main/EDA_iris.ipynb)
## 🎯 Objetivo da Análise
Analisar um conjunto de dados com características das flores Iris (comprimento e largura de sépalas e pétalas) para identificar padrões e estimar o número de espécies distintas, usando técnicas exploratórias e clustering, sem depender inicialmente dos rótulos das espécies.
## 📊 Fonte de Dados
Os dados provêm de um arquivo CSV disponível publicamente, contendo características das flores Iris. A análise utiliza duas versões: uma sem os nomes das espécies e outra com os rótulos para validação.
## 🛠️ Bibliotecas Utilizadas
- **Pandas**: Manipulação e análise de dados.
- **NumPy**: Cálculos numéricos e operações matemáticas.
- **Seaborn**: Visualizações estatísticas aprimoradas.
- **Matplotlib**: Geração de gráficos e plots.
- **Scikit-learn**: Implementação do algoritmo K-Means e cálculo do WCSS.## 💬 Conclusão
Este projeto realizou uma **Análise Exploratória de Dados (EDA)** no dataset Iris, inicialmente sem os rótulos das espécies. Usando o algoritmo K-Means e o método do cotovelo (baseado no WCSS), identificamos 3 clusters distintos, que, ao serem validados com os rótulos, corresponderam às 3 espécies reais. O estudo destacou a eficácia do clustering não supervisionado para revelar padrões naturais nos dados.