Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/raphael-ufrj/analise_algodao
Análise histórica de plantio de algodão, analise do plantio com base no clima e nos dados históricos.
https://github.com/raphael-ufrj/analise_algodao
analysis data-science data-visualization dataset docker pandas provenance python python3 scikit-learn seaborn streamlit
Last synced: about 1 month ago
JSON representation
Análise histórica de plantio de algodão, analise do plantio com base no clima e nos dados históricos.
- Host: GitHub
- URL: https://github.com/raphael-ufrj/analise_algodao
- Owner: Raphael-UFRJ
- License: mit
- Created: 2024-12-09T04:36:04.000Z (about 1 month ago)
- Default Branch: main
- Last Pushed: 2024-12-09T04:50:08.000Z (about 1 month ago)
- Last Synced: 2024-12-09T05:27:49.159Z (about 1 month ago)
- Topics: analysis, data-science, data-visualization, dataset, docker, pandas, provenance, python, python3, scikit-learn, seaborn, streamlit
- Language: Python
- Homepage:
- Size: 0 Bytes
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# Projeto de Análise de Dados do Algodão no Brasil 🌾
Este projeto analisa dados históricos de plantio de algodão e variáveis climáticas no Brasil, utilizando ferramentas modernas de ciência de dados para gerar insights sobre tendências, regiões promissoras e correlações entre fatores climáticos e área plantada.
![PPGI logo](assets/img/PPGI.png "PPGI logo")
Professores: Sérgio Serra e Jorge Zavatela
## **Objetivo**
O principal objetivo deste projeto é responder às seguintes questões:
1. **Melhores períodos para plantio:** Quais épocas do ano apresentam condições climáticas ideais para o cultivo de algodão?
2. **Regiões com maior potencial:** Quais estados ou regiões no Brasil oferecem o maior potencial para o plantio de algodão?
3. **Influências climáticas:** Como as variáveis climáticas (temperatura, precipitação, umidade, etc.) impactam a área plantada de algodão?## **Tecnologias Utilizadas**
- **Linguagem:** Python 3.9+
- **Bibliotecas:**
- `pandas`, `numpy`: Manipulação e análise de dados.
- `matplotlib`, `seaborn`, `plotly`: Visualização de dados.
- `scikit-learn`: Modelagem preditiva.
- `folium`: Mapas interativos.
- `streamlit`: Interface de usuário interativa para apresentação do projeto.
- **Containerização:** Docker.## **Estrutura do Projeto**
``` bash
.
├── data/
│ ├── raw/ # Dados brutos (históricos e climáticos)
│ ├── processed/ # Dados processados prontos para análise
├── src/
│ ├── app.py # Aplicação principal Streamlit
│ ├── data_cleaning.py # Funções de limpeza e pré-processamento
│ ├── analysis.py # Módulos de análise de dados
│ ├── visualization.py # Funções de visualização (gráficos e mapas)
├── assets/
│ ├── img/ # Imagens
├── requirements.txt # Dependências do projeto
├── Dockerfile # Arquivo Docker para execução do projeto
└── README.md # Documentação do projeto
```## **Instruções para Uso**
- Acesse: https://drive.google.com/drive/folders/15INB0C3GHfH7zBaZHpwy9C73NJF2LhxC?usp=drive_link
- Para pegar o dataset weather_sum_all.csv (O mesmo é muito grande para o github)### **Executando Localmente**
1. **Clone o repositório:**
```bash
git clone https://github.com/Raphael-UFRJ/analise_algodao
cd analise_algodao
```2. **Crie um ambiente virtual e instale as dependências:**
```bash
python3 -m venv venv
source venv/bin/activate # Windows: venv\Scripts\activate
pip install -r requirements.txt
```3. **Execute a aplicação:**
```bash
streamlit run src/app.py
```### **Executando com Docker**
1. **Construa a imagem Docker:**
```bash
docker build -t algodao-analise .
```2. **Inicie o container:**
```bash
docker run -p 8501:8501 algodao-analise
```3. **Acesse a aplicação:**
Abra o navegador e vá para [http://localhost:8501](http://localhost:8501).## **Principais Funcionalidades**
1. **Tendências Sazonais:**
- Identificação de padrões climáticos ao longo dos anos.
- Gráficos interativos para análise de temperatura, precipitação, e outras variáveis.2. **Análise Regional:**
- Mapeamento das melhores regiões para plantio utilizando dados geoespaciais.
- Visualização interativa de mapas coropléticos.3. **Influência Climática:**
- Avaliação das correlações entre variáveis climáticas e área plantada.
- Gráficos para identificar os fatores climáticos mais influentes.4. **Tendências Históricas:**
- Análise de séries temporais para identificar variações na área plantada ao longo das décadas.5. **Previsão de Área Plantada:**
- Uso de regressão linear para prever tendências futuras de plantio.## **Principais Insights**
- **Melhores períodos para plantio:** Primavera e verão destacam-se como os períodos mais favoráveis, devido às temperaturas adequadas e precipitação ideal.
- **Regiões promissoras:** Nordeste e Centro-Oeste apresentam maior potencial devido a fatores climáticos e estruturais.
- **Fatores climáticos relevantes:** Temperatura média e precipitação estão entre os fatores mais fortemente correlacionados com a área plantada.## **Próximos Passos**
- Incorporar aprendizado de máquina para prever rendimentos com base em variáveis climáticas.
- Expandir os dados para incluir novas regiões e variáveis.
- Implementar análises mais avançadas, como detecção de anomalias e clusterização de regiões.## **Artigo**
- [Artigo](https://github.com/Raphael-UFRJ/analise_algodao/blob/main/An%C3%A1lise_de_Dados_Clim%C3%A1ticos_e_Hist%C3%B3ricos_da_Produ%C3%A7%C3%A3o_de_Algod%C3%A3o_no_Brasil.pdf)
---
**Contato:**
Se tiver dúvidas ou sugestões, sinta-se à vontade para abrir uma issue ou enviar um pull request.