Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/ojvribeiro/scrap.js
Web Scraping via client-side
https://github.com/ojvribeiro/scrap.js
Last synced: 3 days ago
JSON representation
Web Scraping via client-side
- Host: GitHub
- URL: https://github.com/ojvribeiro/scrap.js
- Owner: ojvribeiro
- License: mit
- Created: 2021-10-11T14:01:32.000Z (over 3 years ago)
- Default Branch: main
- Last Pushed: 2021-10-13T20:32:25.000Z (over 3 years ago)
- Last Synced: 2024-11-22T21:49:37.730Z (2 months ago)
- Language: JavaScript
- Size: 5.86 KB
- Stars: 4
- Watchers: 2
- Forks: 0
- Open Issues: 1
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# Scrap.js
Web Scraping via client-side
----
## Como usar
Baixe o arquivo `scrap.js` e o inclua em seu HTML:
```html
```
## scrap.get
Chame o método `scrap.get` com os parâmetros `url` e `callback` para fazer a requisição do DOM de uma página da web:
```js
scrap.get(url, callback)
```onde:
- `url` é uma string com a URL do site que você quer extrair o conteúdo;
- `callback` é uma função executada assim que obtiver a resposta. Adicione um parâmetro `response` (ou `res`) para capturar a resposta e armazenar como quiser.
Exemplo:
```js
scrap.get('https://bredi.com.br/', (res) => {
// Faça o que quiser com a response...
const myDocument = res// Por exemplo, extrair todas as imagens e armazenar numa array...
let pageImages = []myDocument.querySelectorAll('img').forEach((el) => {
pageImages.push(el.src)
})console.log(pageImages)
})
```## scrap.getHTML
O método `scrap.getHTML` captura um elemento específico de uma página da web. Ele recebe um parâmetro, que é o objeto com as opções do Scrap.
Option | Value
-----------|-----------------------------------------------------------
`url` | Qualquer URL começando com `http://` ou `https://`
`element` | String com o seletor do elemento que você quer receber
`callback` | Função a ser executada após o sucesso na requisiçãoExemplo:
```js
scrap.getHTML({
url: 'https://bredi.com.br/',
element: '#portfolio article',
callback: (res) => {
// Insere o resultado em um elemento dentro da sua página
document.querySelector('#app').innerHTML = res
}
})
```