https://github.com/emv271828/diabetes_cdc_uci_machine_learning

Segunda avaliação para a disciplina de Inteligência Artificial da Universidade Federal Fluminense.
https://github.com/emv271828/diabetes_cdc_uci_machine_learning

jupyter-notebook machine-learning pandas python scikit-learn

Last synced: 2 months ago
JSON representation

Segunda avaliação para a disciplina de Inteligência Artificial da Universidade Federal Fluminense.

Host: GitHub
URL: https://github.com/emv271828/diabetes_cdc_uci_machine_learning
Owner: EMV271828
Created: 2025-02-21T22:28:14.000Z (over 1 year ago)
Default Branch: main
Last Pushed: 2025-02-21T23:06:11.000Z (over 1 year ago)
Last Synced: 2025-02-21T23:43:44.841Z (over 1 year ago)
Topics: jupyter-notebook, machine-learning, pandas, python, scikit-learn
Language: Jupyter Notebook
Homepage:
Size: 7.61 MB
Stars: 0
Watchers: 1
Forks: 0
Open Issues: 0
Metadata Files:
- Readme: README.md

Awesome Lists containing this project

README

# UCI - Dataset CDC Diabetes Health Indicators - Machine Learning

## Resumo
Uso de técnicas de machine learning no dataset CDC Diabetes Health Indicators - com maiores informações [neste link](https://archive.ics.uci.edu/dataset/891/cdc+diabetes+health+indicators) - como forma de avaliação para a disciplina de Inteligência Artificial, da Universidade Federal Fluminense. Este dataset contém informações sobre pessoas envolvidas em uma pesquisa diagnóstica sobre diabetes.

## Objetivos da avaliação
- Implementar em Python códigos para Árvores de Decisão, Random Forest e Rede Neural Multilayer Perceptron
- Para cada algoritmo, listar as taxas de acurácia e F1 obtidas para cada conjunto de parâmetros
- Explicar a divisão do conjunto de dados para treinamento e teste
- Avaliar a performance dos algoritmos do ponto de vista da métrica e da explicabilidade desses algoritmos
- Análise crítica de escolher e colocar um modelo em produção para o domínio do dataset selecionado

## Tecnologias utilizadas
- ``Pandas``: visualização e manipulação de dados
- ``Scikit Learn``: principais métodos utilizados no trabalho (Decision Tree, Random Forest, Multilayer Perceptron,...)
- ``Seaborn``: visualização das matrizes de correlação e confusão
- ``ucimlrepo``: obtenção dos dados do dataset
- ``Matplotlib``: usado em conjunto com seaborn para visualização de dados
- ``Graphviz``: visualização das árvores de decisão

ecosyste.ms

Data

Tools

Indexes

Applications

Experiments

Awesome

https://github.com/emv271828/diabetes_cdc_uci_machine_learning

Awesome Lists containing this project

README