https://github.com/librauee/dataanalysis
😋Python 3数据分析
https://github.com/librauee/dataanalysis
Last synced: 8 months ago
JSON representation
😋Python 3数据分析
- Host: GitHub
- URL: https://github.com/librauee/dataanalysis
- Owner: librauee
- Created: 2019-02-02T03:00:54.000Z (over 7 years ago)
- Default Branch: master
- Last Pushed: 2020-03-16T15:13:12.000Z (over 6 years ago)
- Last Synced: 2025-01-02T00:27:47.611Z (over 1 year ago)
- Language: HTML
- Homepage:
- Size: 31 MB
- Stars: 12
- Watchers: 1
- Forks: 4
- Open Issues: 1
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# Data Analysis
* Language:Python3
* 一些数据分析的学习实例和自己的数据分析实战汇总
* 我的微信公众号如下,欢迎学习交流

## No.1 台风
* 数据来源:温州台风网
### 台风数量
统计数据发现,1945到2018年共有1699个台风生成,平均每年生成台风22.96个。其中,台风生成最多的年份是1994年,共计有34个台风;台风生成最少的年份是1998年,只有12个台风生成。下面是年份和台风数量的示意图。

### 台风生成
一年之中最早生成的台风是1955年的一号台风Violet,它生成于1955年1月1日早上8时,元旦佳节,台风也来凑热闹~

### 台风生命
从数据中计算得到,台风的平均生命为178小时(约7天)。
其中,寿命最长的台风是发于1972年7月5日,终止于1972年7月30日的台风Rita,历时600小时。自7月9日到7月12日,风力保持在惊人的17级,平均风速达到了65米/每秒。即下图路径中的红色部分。

## No.2 英文名分析
* 数据来源:美国1880年到2017年的新生婴儿取名记录
### Q1:
从2010年到2017年之间最受欢迎的男女生英文名,画出男女生各前10名的年份-数量图,并生成词云

### Q2:
1920年以来每个年代最流行的英文名
### Q3:
以前很流行,现在不流行的英文名,用pyecharts画出折线图,反映出英文名走势

### Q4:
二十一世纪以来越来越流行的英文名字,绘制出折线图,体现变化趋势
### Q5:
影响美国人取名的因素:体育明星、电视明星,选取了一系列名人,绘制折线与柱状图

### Q6:
同一发音的名字,有很多不同的拼写变体,生成词云

### Q7:
一些有特殊含义的名字是否有人取
### Q8:
名字里面带有部分回文的名字有哪些,生成词云
### Tips
* 以pyecharts库中的page自定义渲染多张数量的图片,以html的形式展示
* 目前pyecharts库已更新至新的大版本 V1
* 本代码只能在pyecharts V0.5版本下运行
## No.3 中国最好学科排名分析
* 数据来源:软科最好学科排名
* 工具: Python3.6
* 主要用到的库:pandas,pyecharts
### 全国排名第一的学科最多的高校

### 排名前10%学科最多的高校

### 上榜学科最多的学校

### 最近三年计算机科学与技术高校排名

