Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/naoki-00-ito/js-scraping

Webスクレイピングプラグラム
https://github.com/naoki-00-ito/js-scraping

dotenv javascript nodejs puppeteer scraping

Last synced: 15 days ago
JSON representation

Webスクレイピングプラグラム

Awesome Lists containing this project

README

        

# js-scraping

サイトリニューアル等で、既存サイトのテキストやリンク設定等をそのまま使いたい(構造変更の必要はある)とき用のスクレイピングプラグラム。

## 環境情報

- node 14.16.0
- npm 6.14.11
- puppeteer 19.11.1
- dotenv 16.0.3

## 利用方法

packageをインストールする

```
npm install
```

.env を作成し、スクレイピング対象のページのURLを記述する

```
PAGE_URL=https://www.hoge.hoge
```

scraping.js内、スクレイピング要素指定変数の値を対象要素のセレクターに書き換える

```diff
- const selectorItemWrap = ".item";
- const selectorTitle = ".title";
- const selectorText = ".text";
- const selectorLink = ".link";
+ const selectorItemWrap = ".col";
+ const selectorTitle = ".col__title";
+ const selectorText = ".col__text";
+ const selectorLink = ".col__link";
```

スクレイピングを実行する

```
node scraping.js
```

distディレクトリにCSVが出力される

![スクリーンショット 2023-04-27 18 10 08](https://user-images.githubusercontent.com/117070296/234815955-b98bdb7b-7df0-413e-8b09-358f8eb74d40.png)