Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/strawndri/imersao-dados-2021

Projetos desenvolvidos durante a Imersão Dados, da Alura, em 2021
https://github.com/strawndri/imersao-dados-2021

alura data-science imersao-dados

Last synced: 4 days ago
JSON representation

Projetos desenvolvidos durante a Imersão Dados, da Alura, em 2021

Awesome Lists containing this project

README

        

# 🤿| Imersão Dados 2021

![Licença](https://img.shields.io/badge/Licen%C3%A7a-MIT-f5b5ca.svg)
![Status](https://img.shields.io/badge/Status-Concluído-abf285.svg)

## Índice

- [Sobre o projeto](#sobre-o-projeto)
- [Aprendizagens](#aprendizagens)
- [Como acessar o projeto?](#como-acessar-o-projeto)
- [Tecnologias utilizadas](#tecnologias-utilizadas)
- [Licença](#licença)

## Sobre o projeto

Neste Imersão, proporcionada pela [Alura](https://www.alura.com.br/) em 2021, foram realizadas cinco aulas usando Python e *Machine Learning* para explorar o universo de descoberta de fármacos. Neste estudo, tivemos a participação do [Guilherme Silveira](https://www.linkedin.com/in/guilhermeazevedosilveira/), do [Thiago Gonçalves Santos](https://www.linkedin.com/in/thiago-gon%C3%A7alves-santos/) e da [Vanessa Leiko Oikawa Cardoso](https://www.linkedin.com/in/vanessa-leiko-oikawa-cardoso-77224175/).

## Aprendizagens
* O que é Pandas e como usá-lo para descobrir *insights* a partir de conjuntos de dados;
* Plotagem de gráficos de pizza e de colunas;
* Plotagem e estilização de gráficos com Seaborn e MatplotLib;
* Recursos de seleção e tratamento de dados;
* Aplicação de histograma para visualizar a média de genes;
* Método `describe`, do Pandas, para obter a descrição estatística dos dados;
* Compreensão do `boxplot` e técnicas para tratar *outliers*;
* Cruzamento de informações dos dados, analisando relações entre colunas;
* Relacionamento inicial entre dados de experimentos e tipos genéticos;
* Utilização do gráfico de dispersão para investigar relações entre genes;
* Correlação e discussão sobre causalidade;
* Mapa de calor;
* Combinação de bases de dados com `merge`;
* Análise de relação entre base de dados experimentais e resultados;
* Modelo de *Machine Learning* para classificação de compostos;
* Utilização da biblioteca Scikit-Learn;
* Regressão logística;
* Árvore de decisão;
* O que é *overfitting*.

## Como acessar o projeto?

Os projetos estão separados em 5 partes, todas organizadas no Google Colaboratory, logo, para acessá-las, clique nos links abaixo:

* [Projeto da aula 01](https://colab.research.google.com/github/strawndri/imersao-dados-2021/blob/main/Aula_01.ipynb);
* [Projeto da aula 02](https://colab.research.google.com/github/strawndri/imersao-dados-2021/blob/main/Aula_02.ipynb);
* [Projeto da aula 03](https://github.com/strawndri/imersao-dados-2021/blob/main/Aula_03.ipynb);
* [Projeto da aula 04](https://colab.research.google.com/github/strawndri/imersao-dados-2021/blob/main/Aula_04.ipynb);
* [Projeto da aula 05](https://github.com/strawndri/imersao-dados-2021/blob/main/Aula_05.ipynb).

## Tecnologias utilizadas
- [Google Colaboratory](https://colab.research.google.com/): Ambiente de notebook interativo baseado na nuvem;
- [Python](https://docs.python.org/3/): Linguagem de programação;
- [Pandas](https://pandas.pydata.org/docs/): Biblioteca para manipulação e análise de dados;
- [MatplotLib](https://matplotlib.org/stable/index.html): Biblioteca para criação de gráficos e visualizações;
- [Seaborn](https://seaborn.pydata.org/): Biblioteca de visualização de dados baseada no MatplotLib;
- [Scikit-Learn](https://scikit-learn.org/stable/): Biblioteca de aprendizado de máquina em Python.

## Licença

Este projeto está licenciado sob a [Licença MIT](https://opensource.org/licenses/MIT). Consulte o arquivo `LICENSE` para obter mais informações sobre os termos de licenciamento.

---

✨ Feito com carinho por [Andrieli Gonçalves](https://github.com/strawndri).