Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/owenliang/dht
一个DHT爬虫
https://github.com/owenliang/dht
bencode crawler dht
Last synced: 2 months ago
JSON representation
一个DHT爬虫
- Host: GitHub
- URL: https://github.com/owenliang/dht
- Owner: owenliang
- Created: 2017-12-22T04:41:55.000Z (about 7 years ago)
- Default Branch: master
- Last Pushed: 2018-01-18T07:49:14.000Z (about 7 years ago)
- Last Synced: 2024-03-01T13:41:50.722Z (11 months ago)
- Topics: bencode, crawler, dht
- Language: Go
- Size: 45.9 KB
- Stars: 24
- Watchers: 3
- Forks: 6
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# dht
## 介绍
DHT是去中心化P2P下载的重要技术,它避免了BT下载依赖中心tracker节点来获取拥有资源的节点列表。
DHT通过P2P的方式传播资源的拥有者信息,而不在依靠tracker,而这个传播的算法就是DHT。
DHT并不是下载协议,最终资源下载仍旧是BT协议(种子),DHT是在帮助我们在P2P网络种找到下载地址。
具体参考官方论文:[DHT Protocol](http://www.bittorrent.org/beps/bep_0005.html)
## 计划
分步骤实现一个DHT协议的种子爬虫,因为涉及的知识点比较多,一次性实现也不是很有数,所以暂定一个计划:
* 实现bencode协议的序列化/反序列化(bencode.go)
* 创建UDP SOCKET,尝试向大型的DHT节点发送4种协议的请求,并接受应答进行观察(krpc.go)
* 实现路由表Routing table,利用UDP请求/应答得到的其他Node,维护自己的亲近朋友列表(routing.go)
* 接受外部应答,更新Routing table中活跃状态,或增加节点(不做了,因为爬虫没必要)
* 接受外部调用,返回Routing table信息,更新活跃状态,增加节点(不做了,因为爬虫没必要)
* 将收到的announce peers中的infohash与peer下载地址,先打印成日志保存(已实现)