Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/strawndri/imersao-dados-2021
Projetos desenvolvidos durante a Imersão Dados, da Alura, em 2021
https://github.com/strawndri/imersao-dados-2021
alura data-science imersao-dados
Last synced: 4 days ago
JSON representation
Projetos desenvolvidos durante a Imersão Dados, da Alura, em 2021
- Host: GitHub
- URL: https://github.com/strawndri/imersao-dados-2021
- Owner: strawndri
- License: mit
- Created: 2024-01-26T09:24:06.000Z (10 months ago)
- Default Branch: main
- Last Pushed: 2024-01-26T10:35:58.000Z (10 months ago)
- Last Synced: 2024-01-27T12:04:20.273Z (10 months ago)
- Topics: alura, data-science, imersao-dados
- Language: Jupyter Notebook
- Homepage:
- Size: 352 KB
- Stars: 1
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# 🤿| Imersão Dados 2021
![Licença](https://img.shields.io/badge/Licen%C3%A7a-MIT-f5b5ca.svg)
![Status](https://img.shields.io/badge/Status-Concluído-abf285.svg)## Índice
- [Sobre o projeto](#sobre-o-projeto)
- [Aprendizagens](#aprendizagens)
- [Como acessar o projeto?](#como-acessar-o-projeto)
- [Tecnologias utilizadas](#tecnologias-utilizadas)
- [Licença](#licença)## Sobre o projeto
Neste Imersão, proporcionada pela [Alura](https://www.alura.com.br/) em 2021, foram realizadas cinco aulas usando Python e *Machine Learning* para explorar o universo de descoberta de fármacos. Neste estudo, tivemos a participação do [Guilherme Silveira](https://www.linkedin.com/in/guilhermeazevedosilveira/), do [Thiago Gonçalves Santos](https://www.linkedin.com/in/thiago-gon%C3%A7alves-santos/) e da [Vanessa Leiko Oikawa Cardoso](https://www.linkedin.com/in/vanessa-leiko-oikawa-cardoso-77224175/).
## Aprendizagens
* O que é Pandas e como usá-lo para descobrir *insights* a partir de conjuntos de dados;
* Plotagem de gráficos de pizza e de colunas;
* Plotagem e estilização de gráficos com Seaborn e MatplotLib;
* Recursos de seleção e tratamento de dados;
* Aplicação de histograma para visualizar a média de genes;
* Método `describe`, do Pandas, para obter a descrição estatística dos dados;
* Compreensão do `boxplot` e técnicas para tratar *outliers*;
* Cruzamento de informações dos dados, analisando relações entre colunas;
* Relacionamento inicial entre dados de experimentos e tipos genéticos;
* Utilização do gráfico de dispersão para investigar relações entre genes;
* Correlação e discussão sobre causalidade;
* Mapa de calor;
* Combinação de bases de dados com `merge`;
* Análise de relação entre base de dados experimentais e resultados;
* Modelo de *Machine Learning* para classificação de compostos;
* Utilização da biblioteca Scikit-Learn;
* Regressão logística;
* Árvore de decisão;
* O que é *overfitting*.## Como acessar o projeto?
Os projetos estão separados em 5 partes, todas organizadas no Google Colaboratory, logo, para acessá-las, clique nos links abaixo:
* [Projeto da aula 01](https://colab.research.google.com/github/strawndri/imersao-dados-2021/blob/main/Aula_01.ipynb);
* [Projeto da aula 02](https://colab.research.google.com/github/strawndri/imersao-dados-2021/blob/main/Aula_02.ipynb);
* [Projeto da aula 03](https://github.com/strawndri/imersao-dados-2021/blob/main/Aula_03.ipynb);
* [Projeto da aula 04](https://colab.research.google.com/github/strawndri/imersao-dados-2021/blob/main/Aula_04.ipynb);
* [Projeto da aula 05](https://github.com/strawndri/imersao-dados-2021/blob/main/Aula_05.ipynb).## Tecnologias utilizadas
- [Google Colaboratory](https://colab.research.google.com/): Ambiente de notebook interativo baseado na nuvem;
- [Python](https://docs.python.org/3/): Linguagem de programação;
- [Pandas](https://pandas.pydata.org/docs/): Biblioteca para manipulação e análise de dados;
- [MatplotLib](https://matplotlib.org/stable/index.html): Biblioteca para criação de gráficos e visualizações;
- [Seaborn](https://seaborn.pydata.org/): Biblioteca de visualização de dados baseada no MatplotLib;
- [Scikit-Learn](https://scikit-learn.org/stable/): Biblioteca de aprendizado de máquina em Python.## Licença
Este projeto está licenciado sob a [Licença MIT](https://opensource.org/licenses/MIT). Consulte o arquivo `LICENSE` para obter mais informações sobre os termos de licenciamento.
---
✨ Feito com carinho por [Andrieli Gonçalves](https://github.com/strawndri).