Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

https://github.com/Kr1s77/Python-crawler-tutorial-starts-from-zero

python爬虫教程,带你从零到一,包含js逆向,selenium, tesseract OCR识别,mongodb的使用,以及scrapy框架
https://github.com/Kr1s77/Python-crawler-tutorial-starts-from-zero

Last synced: 3 months ago
JSON representation

python爬虫教程,带你从零到一,包含js逆向,selenium, tesseract OCR识别,mongodb的使用,以及scrapy框架

Lists

README

        

### 分布式爬虫从零开始

+ 从零学习python爬虫

- 欢迎在issues中留言,如果文章中有错别字可以向我提pr,感谢各位!

# 目录

- [引言 ](https://github.com/CriseLYJ/Python-crawler-tutorial-starts-from-zero/blob/master/引言.md)
- [01 - 爬虫预备知识](https://github.com/CriseLYJ/Python-crawler-tutorial-starts-from-zero/blob/master/%E7%88%AC%E8%99%AB%E9%A2%84%E5%A4%87%E7%9F%A5%E8%AF%86.md)
- [02 - 请求分析流程](https://github.com/CriseLYJ/Python-crawler-tutorial-starts-from-zero/blob/master/%E8%AF%B7%E6%B1%82%E5%88%86%E6%9E%90.md)
- [03 - requests模块的使用](https://github.com/CriseLYJ/Python-crawler-tutorial-starts-from-zero/blob/master/%E7%BD%91%E7%BB%9C%E8%AF%B7%E6%B1%82%E6%A8%A1%E5%9D%97%E7%9A%84%E4%BD%BF%E7%94%A8.md)
- [04 - 数据提取概念和数据的分类](https://github.com/CriseLYJ/Python-crawler-tutorial-starts-from-zero/blob/master/%E6%95%B0%E6%8D%AE%E6%8F%90%E5%8F%96%E6%A6%82%E5%BF%B5%E5%92%8C%E6%95%B0%E6%8D%AE%E7%9A%84%E5%88%86%E7%B1%BB.md)
- [05 - JSON数据提取](https://github.com/CriseLYJ/Python-crawler-tutorial-starts-from-zero/blob/master/JSON数据提取.md)
- [06 - re 正则表达式提取数据](https://github.com/CriseLYJ/Python-crawler-tutorial-starts-from-zero/blob/master/06%20-%20%E6%AD%A3%E5%88%99%E8%A1%A8%E8%BE%BE%E5%BC%8F%20%E6%8F%90%E5%8F%96%E6%95%B0%E6%8D%AE.md)

# 实例目录
- [01 - 豆瓣热门爬虫-入门](https://github.com/CriseLYJ/Python-crawler-tutorial-starts-from-zero/blob/master/01-%E8%B1%86%E7%93%A3%E7%94%B5%E5%BD%B1.md)
- [02 - 百度贴吧爬虫-入门](https://github.com/CriseLYJ/Python-crawler-tutorial-starts-from-zero/blob/master/02-%E7%99%BE%E5%BA%A6%E8%B4%B4%E5%90%A7.md)
- [03 - 百度翻译爬虫-逆向](https://github.com/CriseLYJ/Python-crawler-tutorial-starts-from-zero/blob/master/03-%E7%99%BE%E5%BA%A6%E7%BF%BB%E8%AF%91.md)

# 文献整理
## http知识
[维基百科](https://zh.wikipedia.org/wiki/%E8%B6%85%E6%96%87%E6%9C%AC%E4%BC%A0%E8%BE%93%E5%8D%8F%E8%AE%AE)
[百度百科](https://baike.baidu.com/item/http)
[来自简书](https://www.jianshu.com/p/a6d086a3997d)

## Chrome控制台
[官方教程](https://developers.google.com/web/tools/chrome-devtools/console/?hl=zh-cn)
[来自知乎](https://zhuanlan.zhihu.com/p/39340856)

## Requests使用
[官方中文文档](http://docs.python-requests.org/zh_CN/latest/index.html)

## JSON
[菜鸟教程](http://www.runoob.com/json/json-tutorial.html)

## XML
[菜鸟教程](http://www.runoob.com/xml/xml-tutorial.html)