Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/unb-mds/2023-2-squad05-tesouromineiro

https://unb-mds.github.io/2023-2-Squad05-TesouroMineiro/
https://github.com/unb-mds/2023-2-squad05-tesouromineiro

open-data spider webscraping

Last synced: 2 months ago
JSON representation

https://unb-mds.github.io/2023-2-Squad05-TesouroMineiro/

Awesome Lists containing this project

README

        


Tesouro Mineiro





đź“– O que Ă© o projeto?



Este projeto interdisciplinar, fruto da disciplina de MDS (Metodologias de Desenvolvimento de Software), empreende uma jornada inovadora pela extração e análise de dados contidos nos Diários Oficiais do Estado de Minas Gerais. Nosso foco reside na decodificação dessas fontes oficiais para extrair informações relacionadas aos municípios.



đź“– Objetivo a realizar:



Estamos imbuídos no propósito de demonstrar a capacidade de coletar, processar e, crucialmente, visualizar dados relevantes para os municípios. O projeto não apenas visa cumprir os requisitos acadêmicos, mas também busca preencher uma lacuna fundamental ao traduzir informações complexas dos Diários Oficiais.



📖 Como será abordado:



Nossa abordagem se baseia na fusão entre tecnologia e conhecimento, onde utilizamos métodos de extração de dados para obter informações específicas relacionadas aos municípios. Além disso, empregamos os princípios do desenvolvimento web e design de interfaces por meio da biblioteca React, visando criar uma plataforma interativa e intuitiva. Dessa forma, não apenas lidamos com a tecnicalidade da extração e processamento de dados, mas também nos dedicamos a apresentar essas informações de maneira atraente e compreensível para o público em geral.



Acesse a página clicando
aqui



đź’» Tecnologias usadas no projeto



![Python](https://img.shields.io/badge/python-3670A0?style=for-the-badge&logo=python&logoColor=ffdd54)
![JavaScript](https://img.shields.io/badge/javascript-%23323330.svg?style=for-the-badge&logo=javascript&logoColor=%23F7DF1E)
![Docker](https://img.shields.io/badge/docker-%230db7ed.svg?style=for-the-badge&logo=docker&logoColor=white)
![React](https://img.shields.io/badge/React-20232A?style=for-the-badge&logo=react&logoColor=61DAFB)


Fluxo de Processamento






![GitHub repo size](https://img.shields.io/github/repo-size/unb-mds/2023-2-Squad05-TesouroMineiro?style=for-the-badge)
![GitHub issues](https://img.shields.io/github/issues/unb-mds/2023-2-Squad05-TesouroMineiro?style=for-the-badge)
![GitHub pull requests](https://img.shields.io/github/issues-pr/unb-mds/2023-2-Squad05-TesouroMineiro?style=for-the-badge)


É necessário possuir os requisitos para a instalação:




Python

Node.js

Docker





Executando o projeto com o Docker



Siga as etapas abaixo para executar o projeto no Docker:



1. Clone o RepositĂłrio



Clone o repositório em sua máquina local:



```
git clone https://github.com/unb-mds/2023-2-Squad05-TesouroMineiro.git
```


2. Como rodar o container de extração de dados



```
docker compose up
```


Após a execução do comando quatro containers, referentes ao Front, Back e extração dos diários, serão executados.



Executando o projeto sem o Docker



1. Instale as dependĂŞncias Python



Dentro do container navegue até a pasta do projeto:



```
cd /diarios_spiders
```


Verifique se você está no diretório correto executando o comando:

```
pwd
```


Em seguida, instale as dependĂŞncias Python usando o comando a seguir:

```
pip install -r requirements.txt
```


2. Execute o Spider



Agora que todas as configurações estão prontas, você pode executar o Spider com o seguinte comando:

```
scrapy crawl mg_associacao_municipios
```


A partir dessa execução o Spider começará a coletar os dados conforme configurado no projeto.



Como converter os arquivos para .txt e renomear



Dentro da pasta diários_spiders use o comando a seguir:

```
sudo ./main-script.sh
```


2.1 Extraindo os dados:



Execute os seguintes scripts dentro da pasta busca-keywords, nesta ordem:

```
python trechos_municipios.py
python export.py
python dados_completos.py
```


Dentro da pasta municipios, estará o arquivo Json com os dados de todos os municípios.



Executando o frontend localmente



Primeiramente será necessário acessar a pasta do frontend



1. Instale as dependĂŞncias



Abra um terminal ou prompt de comando na pasta do projeto clonado. Execute o comando:

```
npm i
```


2 Iniciar o servidor de desenvolvimento



Após a instalação das dependências, você pode iniciar o servidor de desenvolvimento localmente usando o comando:

```
npm start
```


Depois que o comando npm start for executado com sucesso, o aplicativo estará disponível localmente.



👨‍💻 Desenvolvedores do Projeto









Iderlan JĂşnio








Elias Faria








Claudio Henrique








Murilo BrandĂŁo








Victor Hugo










Pedro Paulo