An open API service indexing awesome lists of open source software.

https://github.com/wxxiong6/crawl

php爬虫系统
https://github.com/wxxiong6/crawl

crawl php spider

Last synced: 5 months ago
JSON representation

php爬虫系统

Awesome Lists containing this project

README

          

php爬虫系统
====

* 程序只支持CLI,执行前需要把php加入环境变量

# 安装程序

### 1.dbconfig.php 添加正确的数据库配置

### 2. 安装程序
```PHP
php run install
```
# 启动程序

### 安装完成后,在setting表添加来源站点及正则提取规则。

### 启动程序 (参数是 setting 表id)
```PHP
php run run 1
```

### 清除项目数据 (参数是 setting 表id)
```PHP
php run clear 1
```

### 完整代码目录
```PHP
│ crawl.sql
│ LICENSE
│ README
│ run 系统入口程序

├─code
│ ├─config 配置文件
│ │ config.php
│ │ dbconfig.php
│ │
│ └─library 类库
│ │ App.php
│ │ Crawl.php
│ │ CrawlCallback.php
│ │ Import.php
│ │ Loader.php
│ │
│ └─db 数据库
│ MysqlPDO.php

├─data 数据

├─log 日志目录

├─tmp
└─web web目录
```