Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/unb-mds/2023-2-squad05-tesouromineiro
https://unb-mds.github.io/2023-2-Squad05-TesouroMineiro/
https://github.com/unb-mds/2023-2-squad05-tesouromineiro
open-data spider webscraping
Last synced: 2 months ago
JSON representation
https://unb-mds.github.io/2023-2-Squad05-TesouroMineiro/
- Host: GitHub
- URL: https://github.com/unb-mds/2023-2-squad05-tesouromineiro
- Owner: unb-mds
- License: mit
- Created: 2023-09-03T12:45:26.000Z (over 1 year ago)
- Default Branch: main
- Last Pushed: 2023-12-15T05:17:46.000Z (about 1 year ago)
- Last Synced: 2023-12-15T06:33:48.918Z (about 1 year ago)
- Topics: open-data, spider, webscraping
- Language: Python
- Homepage: https://tesouromineiro.vercel.app/
- Size: 178 MB
- Stars: 4
- Watchers: 1
- Forks: 3
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE
- Code of conduct: CODE_OF_CONDUCT.md
- Security: SECURITY.md
Awesome Lists containing this project
README
Tesouro Mineiro
đź“– O que Ă© o projeto?
Este projeto interdisciplinar, fruto da disciplina de MDS (Metodologias de Desenvolvimento de Software), empreende uma jornada inovadora pela extração e análise de dados contidos nos Diários Oficiais do Estado de Minas Gerais. Nosso foco reside na decodificação dessas fontes oficiais para extrair informações relacionadas aos municĂpios.
đź“– Objetivo a realizar:
Estamos imbuĂdos no propĂłsito de demonstrar a capacidade de coletar, processar e, crucialmente, visualizar dados relevantes para os municĂpios. O projeto nĂŁo apenas visa cumprir os requisitos acadĂŞmicos, mas tambĂ©m busca preencher uma lacuna fundamental ao traduzir informações complexas dos Diários Oficiais.
📖 Como será abordado:
Nossa abordagem se baseia na fusĂŁo entre tecnologia e conhecimento, onde utilizamos mĂ©todos de extração de dados para obter informações especĂficas relacionadas aos municĂpios. AlĂ©m disso, empregamos os princĂpios do desenvolvimento web e design de interfaces por meio da biblioteca React, visando criar uma plataforma interativa e intuitiva. Dessa forma, nĂŁo apenas lidamos com a tecnicalidade da extração e processamento de dados, mas tambĂ©m nos dedicamos a apresentar essas informações de maneira atraente e compreensĂvel para o pĂşblico em geral.
Acesse a página clicando
aqui
đź’» Tecnologias usadas no projeto
![Python](https://img.shields.io/badge/python-3670A0?style=for-the-badge&logo=python&logoColor=ffdd54)
![JavaScript](https://img.shields.io/badge/javascript-%23323330.svg?style=for-the-badge&logo=javascript&logoColor=%23F7DF1E)
![Docker](https://img.shields.io/badge/docker-%230db7ed.svg?style=for-the-badge&logo=docker&logoColor=white)
![React](https://img.shields.io/badge/React-20232A?style=for-the-badge&logo=react&logoColor=61DAFB)
Fluxo de Processamento
![GitHub repo size](https://img.shields.io/github/repo-size/unb-mds/2023-2-Squad05-TesouroMineiro?style=for-the-badge)
![GitHub issues](https://img.shields.io/github/issues/unb-mds/2023-2-Squad05-TesouroMineiro?style=for-the-badge)
![GitHub pull requests](https://img.shields.io/github/issues-pr/unb-mds/2023-2-Squad05-TesouroMineiro?style=for-the-badge)
É necessário possuir os requisitos para a instalação:
Python
Node.js
Docker
Executando o projeto com o Docker
Siga as etapas abaixo para executar o projeto no Docker:
1. Clone o RepositĂłrio
Clone o repositório em sua máquina local:
```
git clone https://github.com/unb-mds/2023-2-Squad05-TesouroMineiro.git
```
2. Como rodar o container de extração de dados
```
docker compose up
```
Após a execução do comando quatro containers, referentes ao Front, Back e extração dos diários, serão executados.
Executando o projeto sem o Docker
1. Instale as dependĂŞncias Python
Dentro do container navegue até a pasta do projeto:
```
cd /diarios_spiders
```
Verifique se você está no diretório correto executando o comando:
```
pwd
```
Em seguida, instale as dependĂŞncias Python usando o comando a seguir:
```
pip install -r requirements.txt
```
2. Execute o Spider
Agora que todas as configurações estão prontas, você pode executar o Spider com o seguinte comando:
```
scrapy crawl mg_associacao_municipios
```
A partir dessa execução o Spider começará a coletar os dados conforme configurado no projeto.
Como converter os arquivos para .txt e renomear
Dentro da pasta diários_spiders use o comando a seguir:
```
sudo ./main-script.sh
```
2.1 Extraindo os dados:
Execute os seguintes scripts dentro da pasta busca-keywords, nesta ordem:
```
python trechos_municipios.py
python export.py
python dados_completos.py
```
Dentro da pasta municipios, estará o arquivo Json com os dados de todos os municĂpios.
Executando o frontend localmente
Primeiramente será necessário acessar a pasta do frontend
1. Instale as dependĂŞncias
Abra um terminal ou prompt de comando na pasta do projeto clonado. Execute o comando:
```
npm i
```
2 Iniciar o servidor de desenvolvimento
Após a instalação das dependências, você pode iniciar o servidor de desenvolvimento localmente usando o comando:
```
npm start
```
Depois que o comando npm start for executado com sucesso, o aplicativo estará disponĂvel localmente.
👨‍💻 Desenvolvedores do Projeto
Iderlan JĂşnio