An open API service indexing awesome lists of open source software.

https://github.com/xanke/nscan

NodeJs 网页采集器
https://github.com/xanke/nscan

crawler javascript nodejs

Last synced: about 1 month ago
JSON representation

NodeJs 网页采集器

Awesome Lists containing this project

README

          

# NScan

基于 NodeJs 的网页采集器,像 Vue 一样简易配置

## 快速开始

**数据库配置:**

/app/config/default.js

```javascript
module.exports = {
mongodb: 'mongodb://'
}
```

**采集示例和配置详见:**

[/app/demo/](/app/demo/)

**启动采集:**

```shell
npm run start
```

## 里程碑

- [x] 分页采集
- [x] 详情页采集
- [x] 静态页面采集
- [x] 自动编码检测
- [ ] 复杂分页采集
- [x] GET 采集
- [x] POST 采集
- [ ] API 采集
- [ ] 定时采集
- [ ] 采集状态持久化
- [ ] 采集日志
- [ ] 自动任务扫描
- [ ] 任务管理器