Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/cassiofb-dev/web-scraper-uol-banco-de-redacoes
Um Web Scraper para transformar os dados do banco de radações da UOL em JSON
https://github.com/cassiofb-dev/web-scraper-uol-banco-de-redacoes
uol-redacoes web-scraper
Last synced: 10 days ago
JSON representation
Um Web Scraper para transformar os dados do banco de radações da UOL em JSON
- Host: GitHub
- URL: https://github.com/cassiofb-dev/web-scraper-uol-banco-de-redacoes
- Owner: cassiofb-dev
- Created: 2023-05-11T03:55:46.000Z (over 1 year ago)
- Default Branch: master
- Last Pushed: 2023-05-17T02:31:07.000Z (over 1 year ago)
- Last Synced: 2024-12-21T01:12:08.954Z (17 days ago)
- Topics: uol-redacoes, web-scraper
- Language: Python
- Homepage:
- Size: 696 KB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
Web Scraper - Banco de Redações UOLUm Web Scraper para transformar os dados do banco de radações da UOL em JSON
Sobre •
Uso •
Créditos •
Licença## Sobre
Esse projeto tem como objetivo pegar os dados de [https://educacao.uol.com.br/bancoderedacoes/](https://educacao.uol.com.br/bancoderedacoes/) e transformar em um único arquivo JSON. Os dados estão disponibilizados no arquivo [uol_redacoes.json](uol_redacoes.json).
## Uso
Os dados podem ser melhor explorados em [https://jsonhero.io/j/YGwjn8LZVsLF/tree](https://jsonhero.io/j/YGwjn8LZVsLF/tree).
- Docker
- ``docker compose up -d``
- Python 3 nativo
- ``python -m venv venv``
- Ative o ambiente virtual:
- Windows: ``.\venv\Scripts\Activate.ps1``
- Linux: ``source venv/bin/activate``
- ``pip install -r requirements.txt``
- ``python uol_redacoes_scraper.py``### Estrutura JSON
```json
{
"type": "object",
"properties": {
"theme": {
"type": "string"
},
"total": {
"type": "integer"
},
"essays": {
"type": "array",
"items": {
"type": "object",
"properties": {
"title": {
"type": "string"
},
"original_text": {
"type": "string"
},
"corrected_text": {
"type": "string"
},
"points": {
"type": "object",
"properties": {
"writing": {
"type": "string"
},
"theme": {
"type": "string"
},
"knowledge": {
"type": "string"
},
"cohesion": {
"type": "string"
},
"proposal": {
"type": "string"
},
"total": {
"type": "string"
}
},
"required": [
"writing",
"theme",
"knowledge",
"cohesion",
"proposal",
"total"
]
}
},
"required": [
"title",
"original_text",
"corrected_text",
"points"
]
}
}
},
"required": [
"theme",
"total",
"essays"
]
}
```## Créditos
- [Python](https://github.com/python)
- Dependencias listadas no arquivo [requirements.txt](requirements.txt)
- [UOL](https://educacao.uol.com.br/bancoderedacoes/)## Licença
MIT