Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/strawndri/python-ds-pandas-limpeza-tratamento-dados
Projeto de introdução à ciência de dados e Python, da plataforma Alura.
https://github.com/strawndri/python-ds-pandas-limpeza-tratamento-dados
alura data-science pandas python
Last synced: 14 days ago
JSON representation
Projeto de introdução à ciência de dados e Python, da plataforma Alura.
- Host: GitHub
- URL: https://github.com/strawndri/python-ds-pandas-limpeza-tratamento-dados
- Owner: strawndri
- License: mit
- Created: 2024-01-30T11:01:10.000Z (12 months ago)
- Default Branch: main
- Last Pushed: 2024-02-27T13:59:19.000Z (11 months ago)
- Last Synced: 2024-11-17T08:56:18.372Z (2 months ago)
- Topics: alura, data-science, pandas, python
- Language: Jupyter Notebook
- Homepage:
- Size: 1.03 MB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# 🐼| Pandas: limpeza e tratamento de dados
![Licença](https://img.shields.io/badge/Licen%C3%A7a-MIT-f5b5ca.svg)
![Status](https://img.shields.io/badge/Status-Concluído-abf285.svg)## Índice
- [Sobre o projeto](#sobre-o-projeto)
- [Aprendizagens](#aprendizagens)
- [Como acessar o projeto?](#como-acessar-o-projeto)
- [Tecnologias utilizadas](#tecnologias-utilizadas)
- [Licença](#licença)## Sobre o projeto
Projeto de especialização em análise de dados desenvolvido durante a realização do curso [Pandas: limpeza e tratamento de dados](https://cursos.alura.com.br/course/pandas-limpeza-tratamento-dados), ministrado pelo instrutor [Bruno Raphael](https://www.linkedin.com/in/bruno-raphaell-alves-de-matos/). A partir desse projeto, será trabalhado os processos de limpeza e tratamento de dados com a biblioteca Pandas.
## Aprendizagens
* O que é *"churn"* em um contexto de negócios;
* Normalização de arquivos JSON;
* Obtenção de informações com o método `info()`;
* Identificação e tratamento de *strings* vazias;
* Identificação e tratamento de dados duplicados com os métodos `duplicated()` e `drop_duplicates()`;
* Identificação e remoção de dados nulos;
* O que são *outliers*;
* Métodos para encontrar *outliers* em um conjunto de dados: **Z-Score**, **Regra dos 3 Sigmas**, **Análise de dispersão**, **Método IQR**;
* Remoção de outliers;
* O que são variáveis categóricas e quais são seus tipos;
* Como transformar variáveis categóricas em binárias com o método `get_dummies()`.## Como acessar o projeto?
O projeto foi feito por completo no Google Colaboratory, logo, para acessar a análise, clique no link abaixo:
- [Projeto no Google Colaboratory](https://colab.research.google.com/github/strawndri/python-ds-pandas-limpeza-tratamento-dados/blob/main/Projeto_Python_Data_Science.ipynb)## Tecnologias utilizadas
- [Google Colaboratory](https://colab.research.google.com/): Ambiente de notebook interativo baseado na nuvem;
- [Python](https://docs.python.org/3/): Linguagem de programação;
- [Pandas](https://pandas.pydata.org/docs/): Biblioteca para manipulação e análise de dados;
- [Numpy](https://numpy.org/): Biblioteca para computação numérica em Python;
- [Seaborn](https://seaborn.pydata.org/): Biblioteca de visualização de dados baseada no Matplotlib, com estilos adicionais e recursos estatísticos.
## LicençaEste projeto está licenciado sob a [Licença MIT](https://opensource.org/licenses/MIT). Consulte o arquivo `LICENSE` para obter mais informações sobre os termos de licenciamento.
---
✨ Feito com carinho por [Andrieli Gonçalves](https://github.com/strawndri).