https://github.com/vinouno/BilibiliDanmuCrawler
一个从 bilibili.com 爬取弹幕并生成词云的 Python 项目
https://github.com/vinouno/BilibiliDanmuCrawler
crawler python
Last synced: about 1 month ago
JSON representation
一个从 bilibili.com 爬取弹幕并生成词云的 Python 项目
- Host: GitHub
- URL: https://github.com/vinouno/BilibiliDanmuCrawler
- Owner: vinouno
- Created: 2023-04-02T03:11:52.000Z (about 2 years ago)
- Default Branch: master
- Last Pushed: 2023-04-14T12:18:39.000Z (about 2 years ago)
- Last Synced: 2024-10-27T11:50:30.655Z (6 months ago)
- Topics: crawler, python
- Language: Python
- Homepage:
- Size: 3.33 MB
- Stars: 3
- Watchers: 1
- Forks: 1
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
- awesome-bilibili-extra - BilibiliDanmuCrawler - 弹幕词云生成器. (数据分析 / 直播脚本)
README
# 弹幕词云生成器
Get bullet chat from bilibili.com by crawler and make word cloud这是一个从 bilibili.com 爬取弹幕并生成词云的 Python 项目
效果预览:

## 安装
1. 克隆这个项目
```
git clone [email protected]:vinouno/BilibiliDanmuCrawler.git
cd BilibiliDanmuCrawler
```
2. 使用`conda`命令创建并激活虚拟环境:```
conda env create -f environment.yml
conda activate wordsCloud
```## 用法
替换代码中的`bvid`为你想获取弹幕的视频的 bv 号。
运行`python main.py`,弹幕词云图片将会生成在同一目录下。
## 项目详解
流水账解析:
[弹幕词云生成器](https://vinouno.github.io/posts/29fc4cd/)
## 注意事项
- 本项目使用了[jieba](https://github.com/fxsjy/jieba) 中文分词,仅适用于生成中文词云。
- `cn_stopwords.txt`为停用词表,可以按自己的需求编辑或选择新的停用词表。