Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/rennerocha/pybr2023-tutorial
Tutorial - Raspando Dados da Internet com Python - Python Brasil 2023
https://github.com/rennerocha/pybr2023-tutorial
Last synced: 23 days ago
JSON representation
Tutorial - Raspando Dados da Internet com Python - Python Brasil 2023
- Host: GitHub
- URL: https://github.com/rennerocha/pybr2023-tutorial
- Owner: rennerocha
- License: gpl-3.0
- Created: 2023-10-23T22:55:41.000Z (over 1 year ago)
- Default Branch: main
- Last Pushed: 2023-10-30T17:52:33.000Z (over 1 year ago)
- Last Synced: 2024-11-10T16:53:16.787Z (3 months ago)
- Language: HTML
- Size: 9.78 MB
- Stars: 2
- Watchers: 2
- Forks: 1
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# Raspando Dados Da Internet Com Python
## Python Brasil 2023 - 31 / 10 / 2023## Sobre o tutorial
A informação é abundante e está facilmente disponível na Internet. No entanto, a enorme quantidade de dados pode
ser esmagadora e demorada para navegar. É aí que entra a raspagem de dados - uma ferramenta poderosa usada para
extrair dados de sites e transformá-los em um formato utilizável.Neste tutorial, exploraremos os fundamentos de raspagem de dados e como implementá-los usando Scrapy (um
framework Python). Quer você seja um analista de dados, programador ou pesquisador, este tutorial irá
equipá-lo com as habilidades fundamentais necessárias para criar seu próprio raspador e extrair informações
valiosas de sites.## Antes do tutorial
Clone este repositório para ter acesso à apresentação e também à solução do código dos exercícios sugeridos:
[https://github.com/rennerocha/pybr2023-tutorial](https://github.com/rennerocha/pybr2023-tutorial)Durante o tutorial espera-se que você tente resolver alguns pequenos exercícios usando
[Scrapy](https://scrapy.org), um framework de web scraping. Será a única biblioteca necessária para ser instalada
(quaisquer outras dependências deverão ser instaladas junto com ela).Siga o [guia de instalação do Scrapy](https://docs.scrapy.org/en/latest/intro/install.html) de acordo com sua
plataforma e certifique-se de que você consegue executar a `versão do scrapy` em seu terminal e veja
`Scrapy 2.11.0` como resultado (sem erros).Na plataforma Linux sugiro a utilização de um ambiente virtual. Se tudo estiver certo, só será necessário executar alguns
comandos para ter tudo funcionando e pronto para utilização:```
$ git clone https://github.com/rennerocha/pybr2023-tutorial.git tutorial
$ cd tutorial
$ python3 -m venv .venv
$ source .venv/bin/activate
$ cd code
$ python -m pip install -r requirements
```Em outras plataformas, siga a documentação oficial do Scrapy com o [guia de instatlação](https://docs.scrapy.org/en/latest/intro/install.html)