https://github.com/prog-lucasalves/aed_data_quality
Data Quality Checker com Streamlit e Faker
https://github.com/prog-lucasalves/aed_data_quality
faker pandas poetry python streamlit
Last synced: 2 months ago
JSON representation
Data Quality Checker com Streamlit e Faker
- Host: GitHub
- URL: https://github.com/prog-lucasalves/aed_data_quality
- Owner: Prog-LucasAlves
- License: mit
- Created: 2025-03-03T17:05:41.000Z (over 1 year ago)
- Default Branch: main
- Last Pushed: 2025-03-05T01:05:57.000Z (over 1 year ago)
- Last Synced: 2025-03-20T18:57:07.418Z (over 1 year ago)
- Topics: faker, pandas, poetry, python, streamlit
- Language: Python
- Homepage:
- Size: 40 KB
- Stars: 1
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# 📊 Data Quality Checker com Streamlit e Faker
Este projeto é uma aplicação em **Streamlit** para análise da qualidade de dados. Ele permite upload de **arquivos CSV** ou a **geração de dados falsos** para avaliação de qualidade. A análise inclui:
- ✅ Verificação de valores ausentes.
- ✅ Identificação de linhas duplicadas.
- ✅ Checagem de tipos de dados.
- ✅ Detecção de outliers.
- ✅ Visualização da distribuição das variáveis.
## 🚀 Tecnologias Utilizadas
- [Python](https://www.python.org/)
- [Streamlit](https://streamlit.io/) (Interface gráfica)
- [Pandas](https://pandas.pydata.org/) (Manipulação de dados)
- [Numpy](https://numpy.org/) (Cálculos estatísticos)
- [Seaborn](https://seaborn.pydata.org/) e [Matplotlib](https://matplotlib.org/) (Visualização de dados)
- [Faker](https://faker.readthedocs.io/en/master/) (Geração de dados falsos)
## 📌 Como Instalar e Executar
1️⃣ **Clone o Repositório**
```bash
git clone https://github.com/Prog-LucasAlves/AED_Data_Quality.git
cd data_quality
```
2️⃣ **Criar um ambiente virtual e ativá-lo:**
```bash
python -m venv venv # Criar ambiente virtual
source venv/bin/activate # Para Linux/macOS
venv\Scripts\activate # Para Windows
```
3️⃣ **Instale as Dependências**
```bash
pip install -r requirements.txt
```
4️⃣ **Execute a aplicação**
```bash
streamlit run app.py
```
## 🔹 Como Usar a Aplicação
1️⃣ **Escolha a opção de análise:**
- Fazer upload de um arquivo CSV
- Gerar um dataset faker automaticamente
## 🔧 Personalização
Quer modificar os dados gerados? Edite a função **generate_fake_data()** no código para alterar os campos gerados.
## 📜 Licença
Este projeto está licenciado sob a MIT [License](https://github.com/Prog-LucasAlves/AED_Data_Quality/blob/main/LICENSE) - veja o arquivo LICENSE para mais detalhes.
## 🤝 Contribuição
Quer contribuir? Siga os passos:
- 1️⃣ Faça um fork do projeto
- 2️⃣ Crie uma branch com sua feature (git checkout -b minha-feature)
- 3️⃣ Commit suas mudanças (git commit -m 'Minha nova feature')
- 4️⃣ Faça um push para a branch (git push origin minha-feature)
- 5️⃣ Abra um Pull Request
## ☁️ Deploy(Extra)
- [link](https://aed-data-quality.onrender.com/)