Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/dyegopimentel/kmeans_projeto_integrador_3a
Neste Projeto Integrador iremos utilizar a tecnica de Aprendizado não supervisionado (K-Means) para classificar doenças através dos sintomas dos pacientes.
https://github.com/dyegopimentel/kmeans_projeto_integrador_3a
Last synced: 6 days ago
JSON representation
Neste Projeto Integrador iremos utilizar a tecnica de Aprendizado não supervisionado (K-Means) para classificar doenças através dos sintomas dos pacientes.
- Host: GitHub
- URL: https://github.com/dyegopimentel/kmeans_projeto_integrador_3a
- Owner: DyegoPimentel
- License: mit
- Created: 2020-09-12T23:53:25.000Z (over 4 years ago)
- Default Branch: master
- Last Pushed: 2020-10-17T14:33:12.000Z (over 4 years ago)
- Last Synced: 2024-06-21T18:55:26.291Z (8 months ago)
- Language: Python
- Size: 30.3 KB
- Stars: 1
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# Projeto_Integrador_3A
KMeans - Aprendizado Não Supervisionado
Neste Projeto Integrador iremos utilizar a tecnica de Aprendizado não supervisionado (K-Means) para classificar doenças através dos sintomas dos pacientes.Programas necessarios
- MongoDB: https://www.mongodb.com/try/download/community
- Python(Anaconda): https://www.anaconda.com/products/individual
Passo a Passo
Após instalar o MongoDB e o Python(Anaconda) certifique-se de que sua versão do “pip” esta atualizado, para isso basta entrar via prompt de comando na pasta do seu projeto e digitar:
python -m pip install --upgrade pip
Após isso, podemos instalar o modulo “Pymongo” que fara a conexão da nossa aplicação com o banco de dados, inserindo via prompt de comando na pasta do projeto o seguinte codigo:
python -m pip install pymongo
Precisaremos do modulo "Pandas" para o nosso algoritimo, para isso basta inserir via prompt de comando os seguintes codigos:
pip install wheel
pip install pandas
Usaremos o Matplotlib para gerar os graficos, para isso basta inserir via prompt de comando o seguinte codigo:
python -m pip install -U matplotlib
Para realizar a clusterização iremos utilizar a biblioteca do sklearn, para isso basta inserir via prompt de comando o seguinte codigo:
pip install -U scikit-learn
Arquivos Inclusos
O arquivo “dataset.py” é responsável por criar o banco de dados “projeto_integrador_3A”, e criar a coleção “sintomas”. Dentro desta coleção, será inserido 30 documentos de pacientes com 3 doenças distintas (COVID-19, Dengue, Depressão). Este dataset é fictício, fique à vontade para usar outro dataset caso tenha interesse.
O arquivo "kmeans.py" é responsavel por realizar o agrupamento dos pacientes baseado nos sintomas, e após os clusters serem formados, um grafico informando a qual cluster cada doença pertence é gerado.
Pontifícia Universidade Católica de Goiás
PROJETO INTEGRADOR 3-A
Curso: Big Data e Inteligência Artificial
Professor: Gustavo Siqueira Vinhal
Alunos: Diego de Medeiros, Dyego Pimentel, Vanessa Pereira, Ysaque Araujo.
Semestre: 2020/2