https://github.com/freekatz/jd_sentiment_analysis
一个简单的京东商品评论爬虫、处理、可视化、情感分析与模型评估实践
https://github.com/freekatz/jd_sentiment_analysis
crawler jd spider
Last synced: about 2 months ago
JSON representation
一个简单的京东商品评论爬虫、处理、可视化、情感分析与模型评估实践
- Host: GitHub
- URL: https://github.com/freekatz/jd_sentiment_analysis
- Owner: freekatz
- License: gpl-3.0
- Created: 2020-12-09T02:43:23.000Z (over 4 years ago)
- Default Branch: main
- Last Pushed: 2020-12-28T11:14:20.000Z (over 4 years ago)
- Last Synced: 2025-03-24T01:35:38.796Z (2 months ago)
- Topics: crawler, jd, spider
- Language: Python
- Homepage:
- Size: 3.04 MB
- Stars: 13
- Watchers: 1
- Forks: 1
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# JD_Sentiment_Analysis
一个简单的京东商品评论爬虫、处理、可视化、情感分析与模型评估实践。分为四大模块:爬虫、预处理、分析和可视化、建模,其余还包括配置和工具模块。
- charts目录:存放数据可视化输出结果:词云图、折线图、饼状图
- data目录:存放各种数据:原始数据、预处理数据、训练集和测试集
- res:存放资源文件,stopwords.txt存放停用词
- configs.py:存放所有相关的静态配置
- crawler.py:爬虫模块
- model.py:建模与评估模块
- pipeline.py:主控制模块
- plotter.py:数据可视化模块
- processing.py:数据预处理模块
- utils.py:存放所有相关工具函数
- requirements.txt:存放python库依赖版本信息