https://github.com/viper373/lol-dataanalytics
腾讯游戏-英雄联盟赛事20/21/22年数据综合分析预测
https://github.com/viper373/lol-dataanalytics
crawler-python data-analysis jupyter-notebook lol python spider
Last synced: 3 months ago
JSON representation
腾讯游戏-英雄联盟赛事20/21/22年数据综合分析预测
- Host: GitHub
- URL: https://github.com/viper373/lol-dataanalytics
- Owner: Viper373
- Created: 2022-10-28T19:48:52.000Z (over 2 years ago)
- Default Branch: main
- Last Pushed: 2024-08-10T18:20:33.000Z (11 months ago)
- Last Synced: 2025-03-30T13:14:35.350Z (3 months ago)
- Topics: crawler-python, data-analysis, jupyter-notebook, lol, python, spider
- Language: Jupyter Notebook
- Homepage:
- Size: 5.14 MB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# 🐲本项目简介
League of Legends Pro League 综合分析结果预测
## 🐬简介
该项目是一个数据采集、预处理和分析的项目,主要针对英雄联盟(League of Legends)职业联赛(LPL)的数据进行处理和分析。项目分为两部分,分别是数据采集与预处理(LPL2020Spring_2022SpringData.py)和数据分析与挖掘(DataAnalytics.ipynb)。## 🐠文件结构
- 🐼LPL2020Spring_2022SpringData.py: 包含了数据的采集、预处理和存储部分的代码。
- 🐨DataAnalytics.ipynb: 包含了数据分析部分的代码。
- 🦝/data: 数据分析所需的原始数据文件。
- 🐻/docs: 项目文档报告、PPT。
## 🦈功能与实现
`LPL2020Spring_2022SpringData.py`
- 🐅数据采集部分:使用requests库和Selenium模拟浏览器访问数据API接口,获取数据,并使用BeautifulSoup解析网页数据。
- 🐆数据预处理部分:将获取到的数据进行清洗和处理,包括数据选择、数据转换、数据排序等操作,并将处理后的数据写入到MySQL数据库中。
- 🦨数据库连接和关闭:使用pymysql库连接本地MySQL数据库,进行数据的读写操作,并在数据处理完成后关闭数据库连接。
`DataAnalytics.ipynb`
- 🦏数据读取部分:使用pandas库读取Excel文件中的数据,并进行数据检查。
- 🐘多元线性回归模型拟合:使用最小二乘法(OLS)拟合多元线性回归模型,得到回归系数。
- 🦍模型检验部分:对拟合的模型进行可决系数、标准估计误差和T检验等统计分析,评估模型的拟合效果和显著性。
## 🐳数据文件说明
- 🦢/data: 包含了LPL2020-2022各战队的数据,用于数据分析部分的模型拟合和检验。
- 🦚/docs: 包含了项目文档报告、PPT。## 🐋使用说明
🙈1.在确保安装了所需的Python库的前提下,分别运行LPL2020Spring_2022SpringData.py和DataAnalytics.ipynb文件。🙊2.执行LPL2020Spring_2022SpringData.py文件将完成数据的采集、预处理和存储。
🙉3.执行DataAnalytics.ipynb文件将完成数据的读取、多元线性回归模型的拟合与检验。