https://github.com/LiuXingMing/QQSpider
QQ空间爬虫(日志、说说、个人信息)
https://github.com/LiuXingMing/QQSpider
Last synced: 3 months ago
JSON representation
QQ空间爬虫(日志、说说、个人信息)
- Host: GitHub
- URL: https://github.com/LiuXingMing/QQSpider
- Owner: LiuXingMing
- Created: 2016-02-28T11:11:57.000Z (over 9 years ago)
- Default Branch: master
- Last Pushed: 2016-11-25T04:33:23.000Z (over 8 years ago)
- Last Synced: 2024-08-01T18:39:13.551Z (11 months ago)
- Language: Python
- Homepage:
- Size: 18.9 MB
- Stars: 693
- Watchers: 51
- Forks: 339
- Open Issues: 3
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
- awesome-hacking-lists - LiuXingMing/QQSpider - QQ空间爬虫(日志、说说、个人信息) (Python)
README
##**QQSpider1:**##
详情请见博客: [《QQ空间爬虫分享(一天可抓取 400 万条数据) 》](http://blog.csdn.net/bone_ace/article/details/50771839)
如果出现报错:
```
Traceback (most recent call last):
File ".\init.py", line 20, in
my_messages.backups() # 备份爬虫信息
NameError: name 'my_messages' is not defined
```
多半的原因是 BitVector 模块用不了,可自行调试。
如果确定是BitVector用不了的话可以用 "BitVector模块报错解决" 里面的两个文件替换掉原有文件,不使用BitVector判重,改用python的list判重(数据量不大的话效果是一样的)。
------------------------------------------------------- 分界线 -------------------------------------------------------
##**QQSpider2:**##
更新后的版本,详情请见博客: [《QQ空间爬虫分享(2016年11月18日更新)》](http://blog.csdn.net/Bone_ACE/article/details/53213779)
有同学反映,爬QQ空间的很多都是学生想爬一些数据做统计研究的,本不是计算机专业,爬起来比较困难,希望有现成的数据出售。但是因为工作变动,其实今年3月份 程序开发完后我就没有跑过了,所以手上也没有数据。不过接下来我会开一两台机器跑这个爬虫,如果需要数据可以邮件联系我([email protected])。遇到什么问题请尽量留言,方便后来遇到同样问题的同学查看。也可加一下QQ交流群:
。