{"id":13491603,"url":"https://github.com/iamseancheney/python_for_data_analysis_2nd_chinese_version","last_synced_at":"2025-05-14T03:06:46.086Z","repository":{"id":33366064,"uuid":"138245018","full_name":"iamseancheney/python_for_data_analysis_2nd_chinese_version","owner":"iamseancheney","description":"《利用Python进行数据分析·第2版》","archived":false,"fork":false,"pushed_at":"2025-04-07T08:07:59.000Z","size":352,"stargazers_count":8216,"open_issues_count":15,"forks_count":2728,"subscribers_count":170,"default_branch":"master","last_synced_at":"2025-04-08T22:19:51.926Z","etag":null,"topics":["matplotlib","numpy","pandas"],"latest_commit_sha":null,"homepage":"","language":null,"has_issues":true,"has_wiki":null,"has_pages":null,"mirror_url":null,"source_name":null,"license":null,"status":null,"scm":"git","pull_requests_enabled":true,"icon_url":"https://github.com/iamseancheney.png","metadata":{"files":{"readme":"README.md","changelog":null,"contributing":null,"funding":null,"license":null,"code_of_conduct":null,"threat_model":null,"audit":null,"citation":null,"codeowners":null,"security":null,"support":null,"governance":null,"roadmap":null,"authors":null,"dei":null,"publiccode":null,"codemeta":null}},"created_at":"2018-06-22T02:29:56.000Z","updated_at":"2025-04-08T14:05:23.000Z","dependencies_parsed_at":"2022-07-12T16:10:27.946Z","dependency_job_id":"72761c37-d88c-47e7-b920-4b9613af4385","html_url":"https://github.com/iamseancheney/python_for_data_analysis_2nd_chinese_version","commit_stats":null,"previous_names":[],"tags_count":0,"template":false,"template_full_name":null,"repository_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/iamseancheney%2Fpython_for_data_analysis_2nd_chinese_version","tags_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/iamseancheney%2Fpython_for_data_analysis_2nd_chinese_version/tags","releases_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/iamseancheney%2Fpython_for_data_analysis_2nd_chinese_version/releases","manifests_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/iamseancheney%2Fpython_for_data_analysis_2nd_chinese_version/manifests","owner_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners/iamseancheney","download_url":"https://codeload.github.com/iamseancheney/python_for_data_analysis_2nd_chinese_version/tar.gz/refs/heads/master","host":{"name":"GitHub","url":"https://github.com","kind":"github","repositories_count":254059500,"owners_count":22007768,"icon_url":"https://github.com/github.png","version":null,"created_at":"2022-05-30T11:31:42.601Z","updated_at":"2022-07-04T15:15:14.044Z","host_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub","repositories_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories","repository_names_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repository_names","owners_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners"}},"keywords":["matplotlib","numpy","pandas"],"created_at":"2024-07-31T19:00:58.543Z","updated_at":"2025-05-14T03:06:46.069Z","avatar_url":"https://github.com/iamseancheney.png","language":null,"funding_links":[],"categories":["Others","A01_机器学习教程"],"sub_categories":[],"readme":"\u003cimg src=\"https://picx.zhimg.com/80/v2-0ebe4e21000806542deaa1657cf58665_1440w.png\"\u003e\n\n支持免费测试！Swiftproxy 提供全球高质量纯净住宅IP，包括动态住宅代理和静态住宅代理，其最大的特点是其动态流量不过期，流量用完为止，静态IP购买后30天内不限制流量。越来越多的企业选择 Swiftproxy 来满足其住宅代理需求，使其成为网络爬虫和社交媒体管理的首选。Swiftproxy 提供超过 9000 万个 IP 地址，并配备免费的精准定位功能，非常适合社交媒体管理、市场调研和公共数据采集。\n\n\u003cp align=center\u003e\n    \u003ca href=\"https://www.swiftproxy.net/?ref=iamseancheney\"\u003e https://www.swiftproxy.net\u003c/a\u003e\n\u003c/p\u003e\n\n\nSwiftproxy具备哪些优势？\n- 1.庞大的 IP 池和精确定位： 覆盖全球 220 个地区，可将代理服务器定位到城市级别，可适用于网页抓取、数据收集、社交媒体营销、广告验证、品牌保护、SEO等业务。同时，Swiftproxy提供庞大的IP池，具有超9000万个真实住宅IP，确保IP的纯净可靠。\n- 2.灵活会话： 提供轮转会话和粘性会话，允许用户在不同 IP 之间切换或长期保持同一 IP。\n- 3.多协议支持： 支持 HTTP/HTTPS 和 SOCKS5 协议，可以与 650 多种工具和软件选项轻松集成。\n- 4.购买的流量永不过期： 用户可以按照自己的节奏使用购买的数据，无需担心流量过期。\n\n***\n\n\u003cdiv\u003e\n\u003ctable style=\"width:100%\"\u003e\n    \u003ctr\u003e\n        \u003ctd align=center\u003e\n            \u003ca href=\"https://item.jd.com/14260998.html\"\u003e\n                \u003cimg src=\"https://img3.doubanio.com/view/subject/l/public/s34761707.jpg\" height=\"300px\"\u003e\n            \u003c/a\u003e\n        \u003c/td\u003e\n        \u003ctd align=center\u003e\n            \u003ca href=\"https://item.jd.com/12398725.html\"\u003e\n                \u003cimg src=\"https://img3.doubanio.com/view/subject/l/public/s33711257.jpg\" height=\"300px\"\u003e\n            \u003c/a\u003e\n        \u003c/td\u003e\n    \u003c/tr\u003e \n    \u003ctr align=center\u003e\n        \u003cth\u003e\n            \u003ca href=\"https://item.jd.com/14260998.html\"\u003e\n                \u003cp\u003e利用Python进行数据分析》第3版\u003c/p\u003e         \n            \u003c/a\u003e\n        \u003c/th\u003e\n        \u003cth\u003e\n            \u003ca href=\"https://item.jd.com/12398725.html\"\u003e\n                \u003cp\u003e利用Python进行数据分析》第2版\u003c/p\u003e         \n            \u003c/a\u003e\n        \u003c/th\u003e\n    \u003c/tr\u003e\n    \u003ctr\u003e\n        \u003cth align=left\u003e\n            \u003cp\u003e各章导读视频：\u003ca href=\"https://www.bilibili.com/video/BV1pC4y117Bh/\"\u003ehttps://www.bilibili.com/video/BV1pC4y117Bh/\u003c/a\u003e\u003c/p\u003e            \n            \u003cp\u003e微信读书：\u003ca href=\"https://weread.qq.com/web/reader/adc32180813ab8786g014ba6\"\u003ehttps://weread.qq.com/web/reader/adc32180813ab8786g014ba6\u003c/a\u003e\u003c/p\u003e\n            \u003cp\u003e学习笔记：\u003ca href=\"https://github.com/iamseancheney/python_for_data_analysis_3rd_study_note\"\u003epython_for_data_analysis_3rd_study_note\u003c/a\u003e\u003c/p\u003e\n            \u003cp\u003e勘误：\u003ca href=\"https://github.com/iamseancheney/python_for_data_analysis_3rd_study_note/blob/main/%E5%8B%98%E8%AF%AF.md\"\u003e链接（感谢读者们的反馈🙏）\u003c/a\u003e\u003c/p\u003e            \n            \u003cp\u003e在简书上阅读： \u003ca href=\"https://www.jianshu.com/p/16e04213aa91\"\u003ehttps://www.jianshu.com/p/16e04213aa91\u003c/a\u003e\u003c/p\u003e\n            \u003cp\u003e第三版多了41页内容，Pandas升级为1.4.0、Python升级为3.10。第三版最大的变化是紧贴Pandas升级，主要是新增了方法和特性的内容。另外，第三版有作者的\u003ca href=\"https://wesmckinney.com/book/\"\u003e在线开源电子版\u003c/a\u003e了，GitHub\u003ca href=\"https://github.com/wesm/pydata-book\"\u003e地址\u003c/a\u003e。\u003c/p\u003e \n\n第三版目录略有调整，不如第二版和第一版的变化大：\n- 第4章NumPy基础新增了生成伪随机数；\n- 第7章数据清洗新增了扩展数据类型和分类数据，实际是把第二版中第12章的内容放到新版第7章里了；\n- 第11章时间序列新增了分组时间重采样。\n\n曾经不止一次听别人抱怨，Pandas的知识点分散、零碎、不便于记忆。在细节上，作者这次在新版中摒弃了许多容易造成记忆混乱的用法。比如，用`axis = \"columns\"`替代`axis = 1`，简写方式破坏了代码的可读性，作者修改了许多类似的编程细节。新版对初学者更为友好了！\n        \u003c/th\u003e\n        \u003cth align=left\u003e\n            \u003cp\u003e在简书上阅读： \u003ca href=\"https://www.jianshu.com/p/04d180d90a3f\"\u003ehttps://www.jianshu.com/p/04d180d90a3f\u003c/a\u003e\u003c/p\u003e\n            \n下载本书代码，GitHub\u003ca href=\"https://github.com/wesm/pydata-book/tree/2nd-edition\"\u003e地址\u003c/a\u003e（建议把代码下载下来之后，安装好Anaconda，在目录文件夹中用Jupyter notebook打开）。\n\n本书是2017年10月20号正式出版的，和第1版的不同之处有：\n\n* 包括Python教程内的所有代码升级为Python 3.6（第1版使用的是Python 2.7）\n* 更新了Anaconda和其它包的Python安装方法\n* 更新了Pandas为2017最新版\n* 新增了一章，关于更高级的Pandas工具，外加一些tips\n* 简要介绍了使用StatsModels和scikit-learn\n\n对有些内容进行了重新排版。最大的改变是把第1版附录中的Python教程，单列成了现在的第2章和第3章，并且进行了扩充。\n        \u003c/th\u003e\n    \u003c/tr\u003e\n\u003c/table\u003e\n\u003c/div\u003e\n\n***\n\n\u003e 新版《利用Python进行数据分析》上市后，我一直在寻找一本Python数据分析的进阶书。经过漫长的搜索和等待，总算找到了，书名是《Fast Python》(中文书名极速Python)。\n\n\u003cdiv align=center\u003e\n\u003ctable style=\"width:100%\"\u003e\n    \u003ctr\u003e\n        \u003ctd align=center\u003e\n            \u003ca href=\"https://www.amazon.com/Fast-Python-performance-techniques-datasets-ebook/dp/B0C3N4H919\"\u003e\n                \u003cimg src=\"https://pica.zhimg.com/80/v2-b298d639d1535abf0df8c828c8c7cbfa_1440w.png\" height=\"300px\"\u003e\n            \u003c/a\u003e\n        \u003c/td\u003e\n        \u003ctd align=center\u003e\n            \u003ca href=\"https://item.jd.com/14121183.html\"\u003e\n                \u003cimg src=\"https://pic1.zhimg.com/80/v2-2833cf04fb676ef850eb56ff286526ff_1440w.png\" height=\"300px\"\u003e\n            \u003c/a\u003e\n        \u003c/td\u003e\n    \u003c/tr\u003e \n    \u003ctr align=center\u003e\n        \u003cth\u003e\n            \u003ca href=\"https://www.amazon.com/Fast-Python-performance-techniques-datasets-ebook/dp/B0C3N4H919\"\u003e\n                \u003cp\u003eFast Python: High performance techniques for large datasets\u003c/p\u003e         \n            \u003c/a\u003e\n        \u003c/th\u003e\n        \u003cth\u003e\n            \u003ca href=\"https://item.jd.com/14121183.html\"\u003e\n                \u003cp\u003e极速Python：高性能编码、计算与数据分析\u003c/p\u003e         \n            \u003c/a\u003e\n        \u003c/th\u003e\n    \u003c/tr\u003e\n\u003c/table\u003e\n\u003c/div\u003e\n\n\u003cdiv align=center\u003e\n    \u003cp\u003e\u003cb\u003e技术链条：Pandas \u003e Arrow \u003e Ray \u003e ChatGPT \u003e ?\u003c/b\u003e\u003c/p\u003e\n\u003c/div\u003e\n\n这本书在Amazon上市后，评论并不多，只有两个5星评价。但是，看完目录后，我立即就想认真读一读。《利用Python进行数据分析》主要围绕NumPy、Pandas、Matplotlib，内容比较偏基础。而工作中要处理的数据量变得越来越大，对技术的要求越来越高，基础方法已经不够用了，必须使用能处理大规模数据集的新方法。《极速Python》从软件到硬件，从单机到分布式，对Python高性能编程和大数据分析优化进行了系统性讲解。内容亮点包括Python代码分析、数据结构优化、内存优化、高并发编程、NumPy编程、Cython代码重构、pandas进阶、数据存储。针对当下最热点的技术领域，本书还重点讲解了Arrow、GPU编程和分布式数据处理。《Fast Python》比另一本优秀的《High Performance Python》的技术栈还要全！\n\n结合大语言模型研究热潮，阅读《极速Python》可以更好地理解最新的Python数据分析技术对技术界产生了巨大的影响。Pandas的作者Wes近年来主要开发了Arrow。Arrow提供了一种高效的数据格式和交换方式，使得在不同的计算框架和编程语言之间进行数据交换和分析变得更加容易和高效。通过将Arrow和Pandas结合使用，可以获得高性能的数据处理和分析能力。Arrow提供了快速的数据传输和交换机制，而Pandas提供了丰富的数据操作和分析功能。这使得在大规模数据集上进行数据处理和分析变得更加高效和便捷。进而，分布式机器学习框架Ray在Datasets组件中使用了Arrow，而22年底爆火的ChatGPT就是用Ray训练而成的。\n\n***\n\n\u003cdiv align=center\u003e\n\u003c!-- \u003ctable style=\"width:100%\"\u003e --\u003e\n\u003c!--     \u003ctr align=center\u003e --\u003e\n\u003c!--         \u003cth\u003e【Python数据分析群】，拉你入群\u003c/th\u003e --\u003e\n\u003c!--         \u003cth\u003eAI科技论谈·分享AI新知\u003c/th\u003e --\u003e\n\u003c!--     \u003c/tr\u003e --\u003e\n\u003c!--     \u003ctr\u003e --\u003e\n\u003c!--         \u003ctd align=center\u003e --\u003e\n\u003c!--             \u003cimg src=\"https://picx.zhimg.com/80/v2-3301f242afabf3c8365b9ecadef3de6d_1440w.png\" height=\"300px\"\u003e             --\u003e\n\u003c!--         \u003c/td\u003e --\u003e\n\u003c!--         \u003ctd align=center\u003e --\u003e\n\u003c!--             \u003cimg src=\"https://picx.zhimg.com/80/v2-72d0e4f4b373738b400c30a5757edb90_1440w.jpeg\" width=\"160px\"\u003e --\u003e\n\u003c!--         \u003c/td\u003e --\u003e\n\u003c!--     \u003c/tr\u003e  --\u003e\n\u003c!-- \u003c/table\u003e --\u003e\n\u003c/div\u003e\n\n\n\n\n\u003cdiv align=center\u003e\n\u003ctable style=\"width:100%\"\u003e\n    \u003ctr align=center\u003e\n        \u003cth\u003e【Python数据分析群】，拉你入群\u003c/th\u003e\n        \u003cth\u003e用三个月完成了翻译，工作砌码回家码字，手竟然脱皮了 :joy:\u003c/th\u003e\n\u003c!--         \u003cth\u003e感谢赞赏 :sparkling_heart:\u003c/th\u003e --\u003e\n    \u003c/tr\u003e\n    \u003ctr\u003e\n        \u003ctd align=center\u003e\n            \u003cimg src=\"https://picx.zhimg.com/80/v2-3301f242afabf3c8365b9ecadef3de6d_1440w.png\" height=\"300px\"\u003e            \n        \u003c/td\u003e\n        \u003ctd align=center\u003e\n            \u003cimg src=\"https://upload-images.jianshu.io/upload_images/7178691-260d699e695f8e81.jpg\" height=\"300px\"\u003e            \n        \u003c/td\u003e\n\u003c!--         \u003ctd align=center\u003e\n            \u003cimg src=\"https://pic1.zhimg.com/80/v2-c499eb01a64368f08d77776d6f43e26e_1440w.png\" width=\"160px\"\u003e\n        \u003c/td\u003e --\u003e\n    \u003c/tr\u003e \n\u003c/table\u003e\n\u003c/div\u003e\n\n\n","project_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fiamseancheney%2Fpython_for_data_analysis_2nd_chinese_version","html_url":"https://awesome.ecosyste.ms/projects/github.com%2Fiamseancheney%2Fpython_for_data_analysis_2nd_chinese_version","lists_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fiamseancheney%2Fpython_for_data_analysis_2nd_chinese_version/lists"}