Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/strawndri/python-ds-pandas-limpeza-tratamento-dados

Projeto de introdução à ciência de dados e Python, da plataforma Alura.
https://github.com/strawndri/python-ds-pandas-limpeza-tratamento-dados

alura data-science pandas python

Last synced: 4 days ago
JSON representation

Projeto de introdução à ciência de dados e Python, da plataforma Alura.

Awesome Lists containing this project

README

        

# 🐼| Pandas: limpeza e tratamento de dados

![Licença](https://img.shields.io/badge/Licen%C3%A7a-MIT-f5b5ca.svg)
![Status](https://img.shields.io/badge/Status-Concluído-abf285.svg)

## Índice

- [Sobre o projeto](#sobre-o-projeto)
- [Aprendizagens](#aprendizagens)
- [Como acessar o projeto?](#como-acessar-o-projeto)
- [Tecnologias utilizadas](#tecnologias-utilizadas)
- [Licença](#licença)

## Sobre o projeto

Projeto de especialização em análise de dados desenvolvido durante a realização do curso [Pandas: limpeza e tratamento de dados](https://cursos.alura.com.br/course/pandas-limpeza-tratamento-dados), ministrado pelo instrutor [Bruno Raphael](https://www.linkedin.com/in/bruno-raphaell-alves-de-matos/). A partir desse projeto, será trabalhado os processos de limpeza e tratamento de dados com a biblioteca Pandas.

## Aprendizagens

* O que é *"churn"* em um contexto de negócios;
* Normalização de arquivos JSON;
* Obtenção de informações com o método `info()`;
* Identificação e tratamento de *strings* vazias;
* Identificação e tratamento de dados duplicados com os métodos `duplicated()` e `drop_duplicates()`;
* Identificação e remoção de dados nulos;
* O que são *outliers*;
* Métodos para encontrar *outliers* em um conjunto de dados: **Z-Score**, **Regra dos 3 Sigmas**, **Análise de dispersão**, **Método IQR**;
* Remoção de outliers;
* O que são variáveis categóricas e quais são seus tipos;
* Como transformar variáveis categóricas em binárias com o método `get_dummies()`.

## Como acessar o projeto?

O projeto foi feito por completo no Google Colaboratory, logo, para acessar a análise, clique no link abaixo:
- [Projeto no Google Colaboratory](https://colab.research.google.com/github/strawndri/python-ds-pandas-limpeza-tratamento-dados/blob/main/Projeto_Python_Data_Science.ipynb)

## Tecnologias utilizadas
- [Google Colaboratory](https://colab.research.google.com/): Ambiente de notebook interativo baseado na nuvem;
- [Python](https://docs.python.org/3/): Linguagem de programação;
- [Pandas](https://pandas.pydata.org/docs/): Biblioteca para manipulação e análise de dados;
- [Numpy](https://numpy.org/): Biblioteca para computação numérica em Python;
- [Seaborn](https://seaborn.pydata.org/): Biblioteca de visualização de dados baseada no Matplotlib, com estilos adicionais e recursos estatísticos.

## Licença

Este projeto está licenciado sob a [Licença MIT](https://opensource.org/licenses/MIT). Consulte o arquivo `LICENSE` para obter mais informações sobre os termos de licenciamento.

---

✨ Feito com carinho por [Andrieli Gonçalves](https://github.com/strawndri).