https://github.com/Ghauster/Bilivideoinfo
Bilibili视频数据爬虫 精确爬取完整的b站视频数据,包括标题、up主、up主id、精确播放数、历史累计弹幕数、点赞数、投硬币枚数、收藏人数、转发人数、发布时间、视频时长、视频简介、作者简介和标签
https://github.com/Ghauster/Bilivideoinfo
Last synced: 3 months ago
JSON representation
Bilibili视频数据爬虫 精确爬取完整的b站视频数据,包括标题、up主、up主id、精确播放数、历史累计弹幕数、点赞数、投硬币枚数、收藏人数、转发人数、发布时间、视频时长、视频简介、作者简介和标签
- Host: GitHub
- URL: https://github.com/Ghauster/Bilivideoinfo
- Owner: Ghauster
- License: mit
- Created: 2023-04-25T06:15:15.000Z (about 2 years ago)
- Default Branch: main
- Last Pushed: 2023-05-08T10:42:59.000Z (about 2 years ago)
- Last Synced: 2024-10-27T11:51:19.686Z (8 months ago)
- Language: Python
- Size: 475 KB
- Stars: 72
- Watchers: 1
- Forks: 4
- Open Issues: 8
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
- awesome-bilibili-extra - Bilivideoinfo - commit/Ghauster/Bilivideoinfo?label=) |  | (数据分析 / 直播脚本)
README
# B站视频信息爬虫
Bilibili 视频数据爬虫,能**批量**爬取指定视频的信息。
#### 好用的话记得给个star## 亮点
- 爬取的数据**全面**:包括:**标题**、**链接**、**up主**、**up主id**、**精确播放数**、**历史累计弹幕数**、**点赞数**、**投硬币枚数**、**收藏人数**、**转发人数**、**发布时间**、**视频时长(秒)**、**视频简介**、**作者简介**、**标签**(分区、参与的创作活动等等内容也都会成为视频的标签)和**视频aid**
- 爬取的是**精确**数据:例如,播放数是精确的数值(如 123456,而非 12.3 万)
## 使用方法
1. 将需要爬取的**视频链接**(http或https开头)或**视频 ID**(bid) 列表存储在名为 `idlist.txt` 的文件中,每行一个
2. 运行 `python scraper.py`
3. 爬取的数据将保存到名为 `output.xlsx` 的 Excel 文件中
4. 如果有出错,出错的记录会保存到`video_errorlist.txt`中## 注意事项
- **不用登录**,但请确保网络畅通
- 请确保在运行代码之前已安装所需的 Python 库(如 requests、beautifulsoup4 和 openpyxl)