Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/michaelcaxias/anime-web-scraping
Script de raspagem de dados de um site de anime, capturando dados como nome, número e video de episódios.
https://github.com/michaelcaxias/anime-web-scraping
node puppeteer typescript web-scraping
Last synced: 4 days ago
JSON representation
Script de raspagem de dados de um site de anime, capturando dados como nome, número e video de episódios.
- Host: GitHub
- URL: https://github.com/michaelcaxias/anime-web-scraping
- Owner: michaelcaxias
- Created: 2022-03-08T17:36:14.000Z (almost 3 years ago)
- Default Branch: master
- Last Pushed: 2022-07-26T23:55:19.000Z (over 2 years ago)
- Last Synced: 2024-11-08T23:25:36.669Z (about 2 months ago)
- Topics: node, puppeteer, typescript, web-scraping
- Language: TypeScript
- Homepage:
- Size: 206 KB
- Stars: 1
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# Anime Web Scraping (raspagem de dados)
Script de raspagem de dados do site [Goyabu](https://goyabu.com/), tais como nome, número e video de episódios.
### Antes de iniciar, instale as dependências
```bash
npm install
```### Para iniciar o script, rode o comando abaixo:
> ⚠️ Lembre-se de observar o arquivo `animes.json` antes de iniciar o processo para verificar os animes já mapeados.
```bash
npm start
``````ts
// exemplo de uso:Número mínimo de episódios: 1
Número máximo de episódios: 25// estas variaveis percorrerão o link https://goyabu.com/videos/${index}/ com o index de 1 a 25
```
### Pontos de observação
- ⚠️ Não se esqueça de formatar o documento `animes.json` para que fique legível.
| ![preview](https://i.imgur.com/eoyAlgS.png) |
| :---: |
| Executando o atalho `CTRL + SHIFT + P` com a opção "Format Document" selecionada |[![TYPESCRIPT](https://img.shields.io/badge/TypeScript-007ACC?style=for-the-badge&logo=typescript&logoColor=white)](https://www.typescriptlang.org/)
[![NODE](https://img.shields.io/badge/Node.js-339933?style=for-the-badge&logo=nodedotjs&logoColor=white)](https://nodejs.org/)
[![PUPPETEER](https://img.shields.io/badge/Puppeteer-40B5A4?style=for-the-badge&logo=Puppeteer&logoColor=white)](https://pptr.dev/)### Contato
[![Linkedin](https://img.shields.io/badge/LinkedIn-0077B5?style=for-the-badge&logo=linkedin&logoColor=white)](https://www.linkedin.com/in/michaelcaxias/)
Copyright © 2021 Michael Caxias