Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/michaelcaxias/anime-web-scraping

Script de raspagem de dados de um site de anime, capturando dados como nome, número e video de episódios.
https://github.com/michaelcaxias/anime-web-scraping

node puppeteer typescript web-scraping

Last synced: 4 days ago
JSON representation

Script de raspagem de dados de um site de anime, capturando dados como nome, número e video de episódios.

Awesome Lists containing this project

README

        

# Anime Web Scraping (raspagem de dados)

Script de raspagem de dados do site [Goyabu](https://goyabu.com/), tais como nome, número e video de episódios.

### Antes de iniciar, instale as dependências

```bash
npm install
```

### Para iniciar o script, rode o comando abaixo:

> ⚠️ Lembre-se de observar o arquivo `animes.json` antes de iniciar o processo para verificar os animes já mapeados.

```bash
npm start
```

```ts
// exemplo de uso:

Número mínimo de episódios: 1
Número máximo de episódios: 25

// estas variaveis percorrerão o link https://goyabu.com/videos/${index}/ com o index de 1 a 25

```

### Pontos de observação

- ⚠️ Não se esqueça de formatar o documento `animes.json` para que fique legível.

| ![preview](https://i.imgur.com/eoyAlgS.png) |
| :---: |
| Executando o atalho `CTRL + SHIFT + P` com a opção "Format Document" selecionada |

[![TYPESCRIPT](https://img.shields.io/badge/TypeScript-007ACC?style=for-the-badge&logo=typescript&logoColor=white)](https://www.typescriptlang.org/)
[![NODE](https://img.shields.io/badge/Node.js-339933?style=for-the-badge&logo=nodedotjs&logoColor=white)](https://nodejs.org/)
[![PUPPETEER](https://img.shields.io/badge/Puppeteer-40B5A4?style=for-the-badge&logo=Puppeteer&logoColor=white)](https://pptr.dev/)

### Contato

[![Linkedin](https://img.shields.io/badge/LinkedIn-0077B5?style=for-the-badge&logo=linkedin&logoColor=white)](https://www.linkedin.com/in/michaelcaxias/)

Copyright © 2021 Michael Caxias