An open API service indexing awesome lists of open source software.

https://github.com/librauee/dataanalysis

😋Python 3数据分析
https://github.com/librauee/dataanalysis

Last synced: 8 months ago
JSON representation

😋Python 3数据分析

Awesome Lists containing this project

README

          

# Data Analysis

* Language:Python3
* 一些数据分析的学习实例和自己的数据分析实战汇总
* 我的微信公众号如下,欢迎学习交流

![Wechat](https://github.com/librauee/Reptile/blob/master/image/vx_code.jpg)

## No.1 台风

* 数据来源:温州台风网

### 台风数量

统计数据发现,1945到2018年共有1699个台风生成,平均每年生成台风22.96个。其中,台风生成最多的年份是1994年,共计有34个台风;台风生成最少的年份是1998年,只有12个台风生成。下面是年份和台风数量的示意图。
![pic](https://github.com/librauee/DataAnalysis/blob/master/%E5%8F%B0%E9%A3%8E%E5%88%86%E6%9E%90/a.png)

### 台风生成

一年之中最早生成的台风是1955年的一号台风Violet,它生成于1955年1月1日早上8时,元旦佳节,台风也来凑热闹~
![pic](https://github.com/librauee/DataAnalysis/blob/master/%E5%8F%B0%E9%A3%8E%E5%88%86%E6%9E%90/b.jpg)

### 台风生命

从数据中计算得到,台风的平均生命为178小时(约7天)。
其中,寿命最长的台风是发于1972年7月5日,终止于1972年7月30日的台风Rita,历时600小时。自7月9日到7月12日,风力保持在惊人的17级,平均风速达到了65米/每秒。即下图路径中的红色部分。
![pic](https://github.com/librauee/DataAnalysis/blob/master/%E5%8F%B0%E9%A3%8E%E5%88%86%E6%9E%90/c.jpg)

## No.2 英文名分析

* 数据来源:美国1880年到2017年的新生婴儿取名记录

### Q1:
从2010年到2017年之间最受欢迎的男女生英文名,画出男女生各前10名的年份-数量图,并生成词云

![pic](https://github.com/librauee/DataAnalysis/blob/master/%E8%8B%B1%E6%96%87%E5%90%8D%E5%88%86%E6%9E%90/2010%E5%B9%B4%E4%BB%A5%E6%9D%A5%E6%9C%80%E5%8F%97%E6%AC%A2%E8%BF%8E%E7%9A%84%E5%A5%B3%E7%94%9F%E5%90%8DTop10.png)
### Q2:
1920年以来每个年代最流行的英文名

### Q3:
以前很流行,现在不流行的英文名,用pyecharts画出折线图,反映出英文名走势
![pic](https://github.com/librauee/DataAnalysis/blob/master/%E8%8B%B1%E6%96%87%E5%90%8D%E5%88%86%E6%9E%90/%E5%A5%B3%E7%94%9F%E5%A7%93%E5%90%8D%E8%B5%B0%E5%8A%BF%E5%9B%BE.png)
### Q4:
二十一世纪以来越来越流行的英文名字,绘制出折线图,体现变化趋势

### Q5:
影响美国人取名的因素:体育明星、电视明星,选取了一系列名人,绘制折线与柱状图
![pic](https://github.com/librauee/DataAnalysis/blob/master/%E8%8B%B1%E6%96%87%E5%90%8D%E5%88%86%E6%9E%90/%E5%90%8D%E4%BA%BA%E5%90%8D%E5%AD%97%E7%9A%84%E5%BD%B1%E5%93%8D.png)
### Q6:
同一发音的名字,有很多不同的拼写变体,生成词云
![pic](https://github.com/librauee/DataAnalysis/blob/master/%E8%8B%B1%E6%96%87%E5%90%8D%E5%88%86%E6%9E%90/%E5%87%AF%E6%96%AF.png)
### Q7:
一些有特殊含义的名字是否有人取

### Q8:
名字里面带有部分回文的名字有哪些,生成词云

### Tips

* 以pyecharts库中的page自定义渲染多张数量的图片,以html的形式展示
* 目前pyecharts库已更新至新的大版本 V1
* 本代码只能在pyecharts V0.5版本下运行

## No.3 中国最好学科排名分析

* 数据来源:软科最好学科排名

* 工具: Python3.6

* 主要用到的库:pandas,pyecharts

### 全国排名第一的学科最多的高校

![pic](https://github.com/librauee/DataAnalysis/blob/master/%E4%B8%AD%E5%9B%BD%E6%9C%80%E5%A5%BD%E5%AD%A6%E7%A7%91%E6%8E%92%E5%90%8D%E5%88%86%E6%9E%90/1.png)

### 排名前10%学科最多的高校
![pic](https://github.com/librauee/DataAnalysis/blob/master/%E4%B8%AD%E5%9B%BD%E6%9C%80%E5%A5%BD%E5%AD%A6%E7%A7%91%E6%8E%92%E5%90%8D%E5%88%86%E6%9E%90/2.png)

### 上榜学科最多的学校
![pic](https://github.com/librauee/DataAnalysis/blob/master/%E4%B8%AD%E5%9B%BD%E6%9C%80%E5%A5%BD%E5%AD%A6%E7%A7%91%E6%8E%92%E5%90%8D%E5%88%86%E6%9E%90/3.png)

### 最近三年计算机科学与技术高校排名
![pic](https://github.com/librauee/DataAnalysis/blob/master/%E4%B8%AD%E5%9B%BD%E6%9C%80%E5%A5%BD%E5%AD%A6%E7%A7%91%E6%8E%92%E5%90%8D%E5%88%86%E6%9E%90/4.png)

![pic](https://github.com/librauee/DataAnalysis/blob/master/%E4%B8%AD%E5%9B%BD%E6%9C%80%E5%A5%BD%E5%AD%A6%E7%A7%91%E6%8E%92%E5%90%8D%E5%88%86%E6%9E%90/5.png)