https://github.com/lucasdsbr/classificacao_python
https://github.com/lucasdsbr/classificacao_python
preprocessing python svm
Last synced: 10 months ago
JSON representation
- Host: GitHub
- URL: https://github.com/lucasdsbr/classificacao_python
- Owner: lucasDSBR
- Created: 2023-03-11T23:16:36.000Z (almost 3 years ago)
- Default Branch: main
- Last Pushed: 2023-04-09T22:36:48.000Z (over 2 years ago)
- Last Synced: 2025-01-05T04:28:57.780Z (12 months ago)
- Topics: preprocessing, python, svm
- Language: Python
- Homepage:
- Size: 3.91 KB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# Classificacao_python
### Este código utiliza os módulos do scikit-learn para aplicar a técnica de classificação em um conjunto de dados de flores iris, utilizando as árvores de decisão e máquinas de vetor suporte (SVM).
## Pré-processamento
### O conjunto de dados utilizado é carregado pelo módulo load_iris e é composto por 150 amostras de flores iris, sendo que cada amostra possui quatro características medidas em centímetros (comprimento da sépala, largura da sépala, comprimento da pétala e largura da pétala). Os dados são divididos aleatoriamente em conjuntos de treino e teste usando o método train_test_split.
## Mineração
### Duas técnicas de classificação são aplicadas aos dados: árvores de decisão e SVM. A árvore de decisão é instanciada com uma profundidade máxima de 2 e treinada no conjunto de treino usando o método fit. Em seguida, o método predict é usado para gerar as previsões no conjunto de teste. A acurácia é calculada usando o método accuracy_score do scikit-learn. A visualização da árvore é plotada utilizando o método plot_tree do scikit-learn.
### A SVM é instanciada com seus parâmetros padrão e também é treinada no conjunto de treino usando o método fit. Em seguida, o método predict é usado para gerar as previsões no conjunto de teste e a acurácia é calculada usando o método accuracy_score.
## Pós-processamento
### As acurácias das duas técnicas são impressas na tela utilizando a função print, bem como a estrutura da árvore gerada pela técnica de árvore de decisão usando o método export_text.