Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/pedrohcleal/aliexpress_scrape
Scraping de dados de produtos do Aliexpress
https://github.com/pedrohcleal/aliexpress_scrape
aliexpress aliexpress-scraper beautifulsoup4 selenium
Last synced: 5 days ago
JSON representation
Scraping de dados de produtos do Aliexpress
- Host: GitHub
- URL: https://github.com/pedrohcleal/aliexpress_scrape
- Owner: pedrohcleal
- Created: 2024-09-01T16:18:50.000Z (2 months ago)
- Default Branch: master
- Last Pushed: 2024-09-12T00:39:18.000Z (about 2 months ago)
- Last Synced: 2024-10-10T20:43:12.784Z (26 days ago)
- Topics: aliexpress, aliexpress-scraper, beautifulsoup4, selenium
- Language: Python
- Homepage:
- Size: 8.55 MB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 1
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# Aliexpress Scraper
Este projeto realiza scraping de dados de produtos do Aliexpress, extraindo informações como nome do produto, preço, disponibilidade em estoque, detalhes sobre frete e se é a primeira compra.
## Estrutura de Arquivos
- `/chrome_config`: Configuração do driver do Chrome para uso com Selenium.
- `main.py`: Script principal que executa o scraping dos produtos.
- `exemplo.json`: Arquivo de exemplo contendo os links e IDs dos produtos a serem analisados.## Dependências
- `selenium`
- `chromedriver`
- `json`
- `random`### Instalação
1. Clone este repositório:
```bash
git clone https://github.com/pedrohcleal/aliexpress_srape.git
```2. Crie e ative um ambiente virtual:
```bash
python -m venv venv # No Linux: python3 -m venv venv
venv\Scripts\activate # No Linux: source venv/bin/activate
```3. Instale as dependências:
```bash
pip install -r requirements.txt
```4. Configure o driver do Chrome na pasta `chrome_config` caso seja necessário, mas já está pronto para uso
### Como Usar
1. Edite o arquivo `exemplo.json` com os produtos que deseja consultar. O formato é:
```json
[
{
"link": "https://pt.aliexpress.com/item/1005007012057921.html",
"idProduct" : 1,
"oldPrice": 5.50,
"oldStock" : 10
},
{
"link": "https://pt.aliexpress.com/item/1005005970704465.html",
"idProduct" : 2,
"oldPrice": 5.50,
"oldStock" : 10
},
...
]
```2. Execute o script:
```bash
python main.py
```3. O resultado será salvo no arquivo `final_updates_ali.json`.
### Funcionalidades
- **e_primeira_compra**: Verifica se é a primeira compra do usuário no produto.
- **preco_produto**: Extrai o preço atual do produto.
- **verificar_estoque**: Verifica se o produto está em estoque.
- **texto_frete**: Extrai e trata informações sobre o frete.
- **get_ali_id**: Extrai o ID do produto a partir do link da página.### Exemplo de Saída
O script gera um arquivo `final_updates_ali.json` com as seguintes informações:
```json
[
{
"idProduct": "123",
"ali_id": "456789",
"ali_link": "https://www.aliexpress.com/item/example.html",
"ali_nome_produto": "Exemplo de Produto",
"e_primeira_compra": true,
"em_estoque": false,
"frete": {"free_shipping": 1, "shipping": "0"},
"preco": "R$100,00",
"OldStock": 20,
"oldPrice": 23.40,
}
]
```