Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/cassiofb-dev/web-scraper-uol-banco-de-redacoes

Um Web Scraper para transformar os dados do banco de radações da UOL em JSON
https://github.com/cassiofb-dev/web-scraper-uol-banco-de-redacoes

uol-redacoes web-scraper

Last synced: 10 days ago
JSON representation

Um Web Scraper para transformar os dados do banco de radações da UOL em JSON

Awesome Lists containing this project

README

        


Web Scraper - Banco de Redações UOL

Um Web Scraper para transformar os dados do banco de radações da UOL em JSON


Sobre
Uso
Créditos
Licença

## Sobre

Esse projeto tem como objetivo pegar os dados de [https://educacao.uol.com.br/bancoderedacoes/](https://educacao.uol.com.br/bancoderedacoes/) e transformar em um único arquivo JSON. Os dados estão disponibilizados no arquivo [uol_redacoes.json](uol_redacoes.json).

## Uso

Os dados podem ser melhor explorados em [https://jsonhero.io/j/YGwjn8LZVsLF/tree](https://jsonhero.io/j/YGwjn8LZVsLF/tree).

- Docker
- ``docker compose up -d``
- Python 3 nativo
- ``python -m venv venv``
- Ative o ambiente virtual:
- Windows: ``.\venv\Scripts\Activate.ps1``
- Linux: ``source venv/bin/activate``
- ``pip install -r requirements.txt``
- ``python uol_redacoes_scraper.py``

### Estrutura JSON

```json
{
"type": "object",
"properties": {
"theme": {
"type": "string"
},
"total": {
"type": "integer"
},
"essays": {
"type": "array",
"items": {
"type": "object",
"properties": {
"title": {
"type": "string"
},
"original_text": {
"type": "string"
},
"corrected_text": {
"type": "string"
},
"points": {
"type": "object",
"properties": {
"writing": {
"type": "string"
},
"theme": {
"type": "string"
},
"knowledge": {
"type": "string"
},
"cohesion": {
"type": "string"
},
"proposal": {
"type": "string"
},
"total": {
"type": "string"
}
},
"required": [
"writing",
"theme",
"knowledge",
"cohesion",
"proposal",
"total"
]
}
},
"required": [
"title",
"original_text",
"corrected_text",
"points"
]
}
}
},
"required": [
"theme",
"total",
"essays"
]
}
```

## Créditos

- [Python](https://github.com/python)
- Dependencias listadas no arquivo [requirements.txt](requirements.txt)
- [UOL](https://educacao.uol.com.br/bancoderedacoes/)

## Licença

MIT