Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/strawndri/imersao-dados-2021

Projetos desenvolvidos durante a Imersão Dados, da Alura, em 2021
https://github.com/strawndri/imersao-dados-2021

alura data-science imersao-dados

Last synced: about 2 months ago
JSON representation

Projetos desenvolvidos durante a Imersão Dados, da Alura, em 2021

Host: GitHub
URL: https://github.com/strawndri/imersao-dados-2021
Owner: strawndri
License: mit
Created: 2024-01-26T09:24:06.000Z (about 1 year ago)
Default Branch: main
Last Pushed: 2024-01-26T10:35:58.000Z (about 1 year ago)
Last Synced: 2024-11-17T08:57:09.814Z (3 months ago)
Topics: alura, data-science, imersao-dados
Language: Jupyter Notebook
Homepage:
Size: 352 KB
Stars: 2
Watchers: 1
Forks: 0
Open Issues: 0
Metadata Files:
- Readme: README.md
- License: LICENSE

Awesome Lists containing this project

README

        # 🤿| Imersão Dados 2021

![Licença](https://img.shields.io/badge/Licen%C3%A7a-MIT-f5b5ca.svg)

![Status](https://img.shields.io/badge/Status-Concluído-abf285.svg)

## Índice

- [Sobre o projeto](#sobre-o-projeto)

- [Aprendizagens](#aprendizagens)

- [Como acessar o projeto?](#como-acessar-o-projeto)

- [Tecnologias utilizadas](#tecnologias-utilizadas)

- [Licença](#licença)

## Sobre o projeto

Neste Imersão, proporcionada pela [Alura](https://www.alura.com.br/) em 2021, foram realizadas cinco aulas usando Python e *Machine Learning* para explorar o universo de descoberta de fármacos. Neste estudo, tivemos a participação do [Guilherme Silveira](https://www.linkedin.com/in/guilhermeazevedosilveira/), do [Thiago Gonçalves Santos](https://www.linkedin.com/in/thiago-gon%C3%A7alves-santos/) e da [Vanessa Leiko Oikawa Cardoso](https://www.linkedin.com/in/vanessa-leiko-oikawa-cardoso-77224175/).

## Aprendizagens

* O que é Pandas e como usá-lo para descobrir *insights* a partir de conjuntos de dados;

* Plotagem de gráficos de pizza e de colunas;

* Plotagem e estilização de gráficos com Seaborn e MatplotLib;

* Recursos de seleção e tratamento de dados;

* Aplicação de histograma para visualizar a média de genes;

* Método `describe`, do Pandas, para obter a descrição estatística dos dados;

* Compreensão do `boxplot` e técnicas para tratar *outliers*;

* Cruzamento de informações dos dados, analisando relações entre colunas;

* Relacionamento inicial entre dados de experimentos e tipos genéticos;

* Utilização do gráfico de dispersão para investigar relações entre genes;

* Correlação e discussão sobre causalidade;

* Mapa de calor;

* Combinação de bases de dados com `merge`;

* Análise de relação entre base de dados experimentais e resultados;

* Modelo de *Machine Learning* para classificação de compostos;

* Utilização da biblioteca Scikit-Learn;

* Regressão logística;

* Árvore de decisão;

* O que é *overfitting*.

## Como acessar o projeto?

Os projetos estão separados em 5 partes, todas organizadas no Google Colaboratory, logo, para acessá-las, clique nos links abaixo:

* [Projeto da aula 01](https://colab.research.google.com/github/strawndri/imersao-dados-2021/blob/main/Aula_01.ipynb);

* [Projeto da aula 02](https://colab.research.google.com/github/strawndri/imersao-dados-2021/blob/main/Aula_02.ipynb);

* [Projeto da aula 03](https://github.com/strawndri/imersao-dados-2021/blob/main/Aula_03.ipynb);

* [Projeto da aula 04](https://colab.research.google.com/github/strawndri/imersao-dados-2021/blob/main/Aula_04.ipynb);

* [Projeto da aula 05](https://github.com/strawndri/imersao-dados-2021/blob/main/Aula_05.ipynb).

## Tecnologias utilizadas

- [Google Colaboratory](https://colab.research.google.com/): Ambiente de notebook interativo baseado na nuvem;

- [Python](https://docs.python.org/3/): Linguagem de programação;

- [Pandas](https://pandas.pydata.org/docs/): Biblioteca para manipulação e análise de dados;

- [MatplotLib](https://matplotlib.org/stable/index.html): Biblioteca para criação de gráficos e visualizações;

- [Seaborn](https://seaborn.pydata.org/): Biblioteca de visualização de dados baseada no MatplotLib;

- [Scikit-Learn](https://scikit-learn.org/stable/): Biblioteca de aprendizado de máquina em Python.

## Licença

Este projeto está licenciado sob a [Licença MIT](https://opensource.org/licenses/MIT). Consulte o arquivo `LICENSE` para obter mais informações sobre os termos de licenciamento.

---

✨ Feito com carinho por [Andrieli Gonçalves](https://github.com/strawndri).