Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/dyegopimentel/kmeans_projeto_integrador_3a

Neste Projeto Integrador iremos utilizar a tecnica de Aprendizado não supervisionado (K-Means) para classificar doenças através dos sintomas dos pacientes.
https://github.com/dyegopimentel/kmeans_projeto_integrador_3a

Last synced: 6 days ago
JSON representation

Neste Projeto Integrador iremos utilizar a tecnica de Aprendizado não supervisionado (K-Means) para classificar doenças através dos sintomas dos pacientes.

Awesome Lists containing this project

README

        

# Projeto_Integrador_3A
KMeans - Aprendizado Não Supervisionado
Neste Projeto Integrador iremos utilizar a tecnica de Aprendizado não supervisionado (K-Means) para classificar doenças através dos sintomas dos pacientes.

Programas necessarios



  • MongoDB: https://www.mongodb.com/try/download/community

  • Python(Anaconda): https://www.anaconda.com/products/individual


Passo a Passo


Após instalar o MongoDB e o Python(Anaconda) certifique-se de que sua versão do “pip” esta atualizado, para isso basta entrar via prompt de comando na pasta do seu projeto e digitar:

python -m pip install --upgrade pip

Após isso, podemos instalar o modulo “Pymongo” que fara a conexão da nossa aplicação com o banco de dados, inserindo via prompt de comando na pasta do projeto o seguinte codigo:

python -m pip install pymongo

Precisaremos do modulo "Pandas" para o nosso algoritimo, para isso basta inserir via prompt de comando os seguintes codigos:

pip install wheel


pip install pandas

Usaremos o Matplotlib para gerar os graficos, para isso basta inserir via prompt de comando o seguinte codigo:

python -m pip install -U matplotlib

Para realizar a clusterização iremos utilizar a biblioteca do sklearn, para isso basta inserir via prompt de comando o seguinte codigo:

pip install -U scikit-learn

Arquivos Inclusos

O arquivo “dataset.py” é responsável por criar o banco de dados “projeto_integrador_3A”, e criar a coleção “sintomas”. Dentro desta coleção, será inserido 30 documentos de pacientes com 3 doenças distintas (COVID-19, Dengue, Depressão). Este dataset é fictício, fique à vontade para usar outro dataset caso tenha interesse.

O arquivo "kmeans.py" é responsavel por realizar o agrupamento dos pacientes baseado nos sintomas, e após os clusters serem formados, um grafico informando a qual cluster cada doença pertence é gerado.



Pontifícia Universidade Católica de Goiás

PROJETO INTEGRADOR 3-A

Curso: Big Data e Inteligência Artificial

Professor: Gustavo Siqueira Vinhal

Alunos: Diego de Medeiros, Dyego Pimentel, Vanessa Pereira, Ysaque Araujo.

Semestre: 2020/2