Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/pengxiaohua/analysis-of-bikeshare-data
使用Pandas对芝加哥、纽约市和华盛顿特区的共享自行车数据进行一个简单的分析
https://github.com/pengxiaohua/analysis-of-bikeshare-data
Last synced: about 2 months ago
JSON representation
使用Pandas对芝加哥、纽约市和华盛顿特区的共享自行车数据进行一个简单的分析
- Host: GitHub
- URL: https://github.com/pengxiaohua/analysis-of-bikeshare-data
- Owner: pengxiaohua
- Created: 2018-05-20T09:22:52.000Z (over 6 years ago)
- Default Branch: master
- Last Pushed: 2018-05-21T17:57:23.000Z (over 6 years ago)
- Last Synced: 2023-09-05T10:02:06.121Z (over 1 year ago)
- Language: Python
- Homepage:
- Size: 23.9 MB
- Stars: 3
- Watchers: 1
- Forks: 1
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# analysis-of-bikeshare-data
使用Pandas对芝加哥、纽约市和华盛顿特区的共享自行车数据进行一个简单的分析### 自行车共享数据
在过去十年内,自行车共享系统的数量不断增多,并且在全球多个城市内越来越受欢迎。自行车共享系统使用户能够按照一定的金额在短时间内租赁自行车。用户可以在 A 处借自行车,并在 B 处还车,或者他们只是想骑一下,也可以在同一地点还车。每辆自行车每天可以供多位用户使用。由于信息技术的迅猛发展,共享系统的用户可以轻松地访问系统中的基座并解锁或还回自行车。这些技术还提供了大量数据,使我们能够探索这些自行车共享系统的使用情况。
在此项目中,使用 Motivate 提供的数据探索自行车共享使用模式,Motivate 是一家入驻美国很多大型城市的自行车共享系统。比较以下三座城市的系统使用情况:芝加哥、纽约市和华盛顿特区。
### 数据集
有三座城市 2017 年上半年的数据。三个数据文件都包含相同的核心六 (6) 列:* 起始时间 Start Time(例如 2017-01-01 00:07:57)
* 结束时间 End Time(例如 2017-01-01 00:20:53)
* 骑行时长 Trip Duration(例如 776 秒)
* 起始车站 Start Station(例如百老汇街和巴里大道)
* 结束车站 End Station(例如塞奇威克街和北大道)
* 用户类型 User Type(订阅者 Subscriber/Registered 或客户Customer/Casual)
芝加哥和纽约市文件还包含以下两列:* 性别 Gender
* 出生年份 Birth Year### 问题
主要处理以下关于自行车共享数据的问题:* 起始时间(Start Time 列)中哪个月份最常见?
* 起始时间中,一周的哪一天(比如 Monday, Tuesday)最常见? 提示:可以使用 datetime.weekday() (点击查看文档)
* 起始时间中,一天当中哪个小时最常见?
* 总骑行时长(Trip Duration)是多久,平均骑行时长是多久?
* 哪个起始车站(Start Station)最热门,哪个结束车站(End Station)最热门?
* 哪一趟行程最热门(即,哪一个起始站点与结束站点的组合最热门)?
* 每种用户类型有多少人?
* 每种性别有多少人?
* 出生年份最早的是哪一年、最晚的是哪一年,最常见的是哪一年?### 文件
* bikeshare.py
* chicago.csv
* new_york_city.csv
* washington.csv