https://github.com/jackfrued/python-for-data-analysis
https://github.com/jackfrued/python-for-data-analysis
Last synced: 5 months ago
JSON representation
- Host: GitHub
- URL: https://github.com/jackfrued/python-for-data-analysis
- Owner: jackfrued
- Created: 2023-04-10T14:43:25.000Z (about 3 years ago)
- Default Branch: master
- Last Pushed: 2025-12-18T12:07:23.000Z (6 months ago)
- Last Synced: 2025-12-21T18:09:51.840Z (6 months ago)
- Size: 22.6 MB
- Stars: 31
- Watchers: 1
- Forks: 7
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
## Python-for-Data-Analysis
Pandas 2.0发布了,是时候把之前写的 Python 数据分析的教程重新整理一下了,顺便也探索一下 pandas 2.0 的新东西,跟 Polars 做一下比较。准备花两周时间把这套教程更新完,在花点时间对比下 Polars 以及其他工具。喜欢这套课程的小伙伴可以 Star 鼓励一下,非常感谢!Github 最近在国内访问确实让人难受,国内的小伙伴如果觉得这套课程还不错,可以看我在知乎专栏上的分享([传送门](https://www.zhihu.com/column/c_1217746527315496960)),相关视频在B站上可以找到([传送门](https://space.bilibili.com/1177252794/channel/collectiondetail?sid=502289))。有付费学习咨询需求的小伙伴可以加入付费交流群,新用户可以通过下方二维码付费之后添加我的私人微信(微信号:**jackfrued**),然后邀请大家进入付费学习打卡群,添加微信时请备注好自己的称呼和需求,我会为大家提供力所能及的帮助。

#### 01 - [数据分析概述](01.数据分析概述.md)
1. 数据分析师的职责
2. 数据分析师的技能栈
3. 数据分析相关库
#### 02 - [环境准备](02.环境准备.md)
1. 安装和使用anaconda
- conda相关命令
2. 安装和使用jupyter-lab
- 安装和启动
- 使用小技巧
#### 03 - [NumPy的应用-1](03.NumPy的应用-1.md)
1. 创建数组对象
2. 数组对象的属性
3. 数组对象的索引运算
- 普通索引
- 花式索引
- 布尔索引
- 切片索引
4. 案例:使用数组处理图像
#### 04 - [NumPy的应用-2](04.NumPy的应用-2.md)
1. 数组对象的相关方法
- 获取描述性统计信息
- 其他相关方法
#### 05 - [NumPy的应用-3](05.NumPy的应用-3.md)
1. 数组的运算
- 数组跟标量的运算
- 数组跟数组的运算
2. 通用一元函数
3. 通用二元函数
4. 广播机制
5. Numpy常用函数
#### 06 - [NumPy的应用-4](06.NumPy的应用-4.md)
1. 向量
2. 行列式
3. 矩阵
4. 多项式
#### 07 - [深入浅出pandas-1](07.深入浅出pandas-1.md)
1. 创建Series对象
2. Series对象的运算
3. Series对象的属性和方法
#### 08 - [深入浅出pandas-2](08.深入浅出pandas-2.md)
1. 创建DataFrame对象
2. DataFrame对象的属性和方法
3. 读写DataFrame中的数据
#### 09 - [深入浅出pandas-3](09.深入浅出pandas-3.md)
1. 数据重塑
- 数据拼接
- 数据合并
2. 数据清洗
- 缺失值
- 重复值
- 异常值
- 预处理
#### 10 - [深入浅出pandas-4](10.深入浅出pandas-4.md)
1. 数据透视
- 获取描述性统计信息
- 排序和头部值
- 分组聚合
- 透视表和交叉表
2. 数据呈现
#### 11 - [深入浅出pandas-5](11.深入浅出pandas-5.md)
1. 计算同比环比
2. 窗口计算
3. 相关性判定
#### 12 - [深入浅出pandas-6](12.深入浅出pandas-6.md)
1. 索引的使用
- 范围索引
- 分类索引
- 多级索引
- 间隔索引
- 日期时间索引
#### 13 - [数据可视化-1](13.数据可视化-1.md)
1. 安装和导入matplotlib
2. 创建画布
3. 创建坐标系
4. 绘制图表
- 折线图
- 散点图
- 柱状图
- 饼状图
- 直方图
- 箱线图
5. 显示和保存图表
#### 14 - [数据可视化-2](14.数据可视化-2.md)
1. 气泡图
2. 面积图
3. 雷达图
4. 玫瑰图
5. 3D图表
#### 15 - [数据可视化-3](15.数据可视化-3.md)
1. Seaborn
2. Pyecharts
#### 有用的资源
1. [Jupyter快捷键参考手册](Jupyter-Shortcuts.pdf)
2. [DataCamp的NumPy基础速查手册](DataCamp-NumPy-Basics-Cheat-Sheet.pdf)
3. [DataCamp的Pandas速查手册](DataCamp-Pandas-Cheat-Sheet.pdf)
4. [DataCamp的Matplotlib速查手册](DataCamp-Matplotlib-Cheat-Sheet.pdf)
5. [Pandas数据清洗速查手册](Data-Wrangling-with-pandas-Cheat-Sheet.pdf)
6. [Matplotlib应用速查手册](Matplotlib-Cheat-Sheets.pdf)