An open API service indexing awesome lists of open source software.

https://github.com/garthtb/bcc_freq_spider

BCC语料库的词频爬虫
https://github.com/garthtb/bcc_freq_spider

Last synced: 2 months ago
JSON representation

BCC语料库的词频爬虫

Awesome Lists containing this project

README

        

# [BCC语料库](https://bcc.blcu.edu.cn/)词频爬虫

语料文件须为UTF-8编码。每行为一个搜索项,理论上搜什么都可以。以搜索到的结果数为词频。

未找到BCC语料库的许可证,慎用!

## 需要用户输入的参数:

1. 语料文件路径
2. 并发数(默认为8,建议不超过10)
3. 网页超时(默认为30秒)

### [相同功能、依赖.NET6运行时的C#版](https://github.com/GarthTB/BCCFreqSpider)