https://github.com/code4craft/imgcrawler
imgcrawler是一个把电商网站的搜索结果抓取过来并且集中到网页展示的工具,用途?不晓得,其实这是一个培训的作业,因为实现的比较完整,就给传上来了。
https://github.com/code4craft/imgcrawler
Last synced: 8 months ago
JSON representation
imgcrawler是一个把电商网站的搜索结果抓取过来并且集中到网页展示的工具,用途?不晓得,其实这是一个培训的作业,因为实现的比较完整,就给传上来了。
- Host: GitHub
- URL: https://github.com/code4craft/imgcrawler
- Owner: code4craft
- Created: 2012-08-26T10:36:15.000Z (over 13 years ago)
- Default Branch: master
- Last Pushed: 2012-08-26T10:46:55.000Z (over 13 years ago)
- Last Synced: 2025-06-13T11:08:00.778Z (8 months ago)
- Size: 563 KB
- Stars: 5
- Watchers: 2
- Forks: 4
- Open Issues: 1
-
Metadata Files:
- Readme: README
Awesome Lists containing this project
README
######################################ImgCrawler版本0.0.1######################################
##############################################################################################
###################################@author 黄亿华 flashsword20@gmail.com#######################
##############################################################################################
Features:
1.configure.py是配置文件,可以通过修改配置支持不同的网站,目前写了京东和淘宝两家。
2.templates是输出页面的模版文件,借鉴了老东家点点网的一个模版,暂时使用简单的字符串替换完成
3.crawler是可执行文件
TODO: 因为机器上死活装不了libjpeg,因此图片的缩放和格式转换没法通过,代码写了,但是不知道对不对,先注释在这里了!