Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/yunwei37/covid-19-nlp-vis
使用 flask + pyecharts 搭建的新冠肺炎疫情数据可视化交互分析网站平台,包含疫情数据获取、每日疫情地图、曲线图展示,数据统计分析、态势感知、确诊人数预测分析算法设计、NLP舆情监测等任务(部署在http://covid.yunwei123.tech/)
https://github.com/yunwei37/covid-19-nlp-vis
covid-19 flask maps nlp pyecharts visualization
Last synced: 1 day ago
JSON representation
使用 flask + pyecharts 搭建的新冠肺炎疫情数据可视化交互分析网站平台,包含疫情数据获取、每日疫情地图、曲线图展示,数据统计分析、态势感知、确诊人数预测分析算法设计、NLP舆情监测等任务(部署在http://covid.yunwei123.tech/)
- Host: GitHub
- URL: https://github.com/yunwei37/covid-19-nlp-vis
- Owner: yunwei37
- License: mit
- Created: 2020-05-21T14:00:48.000Z (over 4 years ago)
- Default Branch: master
- Last Pushed: 2022-10-30T04:46:11.000Z (over 2 years ago)
- Last Synced: 2025-01-21T17:06:40.311Z (10 days ago)
- Topics: covid-19, flask, maps, nlp, pyecharts, visualization
- Language: HTML
- Homepage: http://covid.yunwei123.tech/
- Size: 14.6 MB
- Stars: 333
- Watchers: 5
- Forks: 68
- Open Issues: 2
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# 疫情预测与舆情分析
> 本项目的技术栈足够初级,应该很适合作为新手入门数据分析与可视化的项目。基本上只要了解 python,具备基本的爬虫、网络、html 等知识就可以实现。
新型冠状病毒肺炎(COVID-19,简称“新冠肺炎”)疫情肆虐全球多个国家,2020年3月11日,世界卫生组织 (WHO) 正式宣布将新冠肺炎列为全球性大流行病。
在全球抗击新型冠状病毒疫情的过程中,产生了前所未有的大规模疫情数据,利用大数据分析技术和方法能够协助发现病毒传染源、监测疫情发展、调配救援物资,从而更好地进行疫情防控工作。空间数据分析作为大数据分析的重要组成,将数据智能处理、直观展示和交互分析有机地结合,使机器智能和人类智慧深度融合、优势互补,为疫情防控中的分析、指挥和决策提供有效依据和指南。
本项目希望能利用交互式空间数据分析技术,使用 flask + pyecharts 搭建简单新冠肺炎疫情数据可视化交互分析平台,感知和预测疫情发展趋势与关键节点、分析社交媒体话题与情感的动态演变、对社会舆情进行态势感知。
项目分析报告已部署到网页端,可点击[http://covid.yunwei123.tech/](http://covid.yunwei123.tech/)进行查看
交互可视化分析报告截图:
## 文档与目录结构
- dataSets
- china_provincedata.csv 中国各省、直辖市、自治区、特别行政区的疫情数据
- countrydata.csv 全球214个国家地区以及钻石公主号邮轮的疫情数据
- nCoV_900k_train.unlabled.csv
>数据集依据与“新冠肺炎”相关的230个主题关键词进行数据采集,抓取了2020年1月1日—2020年2月20日期间共计100万条微博数据,并对其中10万条数据进行人工标注,标注分为三类,分别为:1(积极),0(中性)和-1(消极)。- nCoV_100k_train.labled.csv 同上,有标注
> 由于原始数据集找不到了,目前只有处理过的文件
- nCov_10k_test.csv 同上
- yqkx_data-5_21.csv 使用爬虫获取的人民网疫情快讯新闻100篇
- 中国社会组织_疫情防控-5_21.csv 中国社会组织公共服务平台疫情防控专区新闻
- weiboComments-5_21.csv 5.21微博《战疫情》主题下的微博和评论数据
- notebook 分析时使用的notebook
- myScripts python脚本(爬虫、可视化、数据处理等等)
- spider-yqkx.py 人民网爬虫
- spider-社会组织.py 中国社会组织公共服务平台爬虫
- weibo_战疫情爬虫_spider.py 微博《战疫情》爬虫
- pyecharts-zhexian-country.py 使用pyecharts绘制任一国家疫情数据曲线图
- hierachy.py 层次聚类分析代码
- jiebafenci.py jieba分词代码及词云图渲染
- lineCountry.py 生成疫情曲线图
- logistic.py logistic分析代码
- mapchina.py 生成中国疫情地图
- mapworld.py 生成世界疫情地图
- mergeweibo.py weiboprocess.py 微博数据处理工具
- weiboAnalyse.py 微博数据分析代码
- wordData.py weiboWordData.py 词云图保存数据
- tfidf.py tfidf值可视化
- sentiments.py 情感分析
- templates: 网站html/css/js及图片文件- index.md:网站的 markdown 版本
- server.py:flask app
- 新冠肺炎时序数据预测算法设计.docx## 作业部分相关技术栈
- 数据库的构建与 sql 语句查询
- pyEchart 可视化
- postgres sql 数据分析
- snowNLP 情感分析
- jieba
- flask## 运行:
1. 运行 server.py:
Use docker:
```
docker build -t covidvisimage .
docker run -d --name covidvis -p 5000:5000 covidvisimage
```OR:
```
pip3 install -r requirements.txt
python3 server.py
```2. 打开 http://127.0.0.1:5000/
注:此处使用的pyecharts版本为`1.7.1`,可能和后续 1.8 以上的版本存在部分不兼容,可以通过以下命令安装:
>pip install pyecharts==1.7.1