python3 Pandas LTS 收集
网址收集
https://pythonprogramming.net/introduction-python3-pandas-data-analysis/
I will be using Python 3.7 and Pands 0.24.1
https://www.activestate.com/products/python/downloads-python-programming/
ActivePython-3.7.4.0000-win64-x64-07ca90fa.msi
nstall via Command Line
Beta
The State Tool sets up your local development environment with everything you need to use this build. Learn more
1Install the State Tool
Run in Powershell - What’s that?
IEX(New-Object Net.WebClient).downloadString(‘https://platform.activestate.com/dl/cli/install.ps1’)
When installation completes, please continue in a CMD Prompt. Powershell isn’t currently supported.
2Install this runtime
Run in a CMD Prompt
state activate wowocpp9527/ActivePython-3.7
Planning to deploy a distribution in a production setting?
Please make sure your use conforms to our license.
某乎回答
以中文书而言,这本算是不错的,作者就是pandas的最初开发者。这本书我买的是Kindle版本,不知道为何近期kindle版本下线了。
其实,如果你习惯看英文文档,不妨从官方的10 Minutes to pandas(10 Minutes to pandas)开始看,最基本的操作速成都有了,而且网上还有中文翻译版,叫十分钟搞定pandas。当然,这个是速成,要了解细节功能,还是看文档吧,pandas: powerful Python data analysis toolkit ,个人感觉文档的清晰度其实比上面那本书来得还要好。当然,如果你还需要看如果提取美股数据,就要增加看pandas-datareader(pandas-datareader - pandas-datareader 0.1 documentation)的基本用法介绍。如果要折腾A股数据,那么看下Tushare的使用介绍(TuShare -财经数据接口包)即可。
。
书籍类这类型推荐一本就够了,就是「Python for Data Analysis 2nd Edition」, 是Pandas的作者写的。之前也有人提到了,不过这里要推荐的是第二版,第一版用的是Python2,而且很多pakcage或者function有的现在已经不推荐使用了,所以第一版有点过时了,第二版是几年前出的,基于Python3,内容都更新了,个人感觉内容的逻辑更为合理。当时买了第一版一直没看,等到要看的时候发现出第二版了ToT,最悲伤的事就是书还没看就已经过时了吧。
MOOC类
DateQuest - 这个感觉比较小众,没有多少人用过,不过这个是帮我入门Pandas的教程,形式是在网上互动式的教学,学一点写一点,很容易就了解Pandas的逻辑,里面也有Numpy和Matplotlit的内容,是个入门的好方法,可以学完这个再看书。Udemy Python for Data Science and Machine Learning - 这门课的作者同时也教SQL,Python编程和可视化的课,课程调理十分清晰,讲解也十分清楚,跟着他敲代码就可以了。
链接:https://www.zhihu.com/question/56310477/answer/790315313
文章原标题《Basic Time Series Manipulation with Pandas》
Pandas 是基于 NumPy 的一种数据处理工具,该工具为了解决数据分析任务而创建。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的函数和方法。 Pandas 的数据结构:Pandas 主要有 Series(一维数组),DataFrame(二维数组),Panel(三维数组),Panel4D(四维数组),PanelND(更多维数组)等数据结构。其中 Series 和 DataFrame 应用的最为广泛。- Series 是一维带标签的数组,它可以包含任何数据类型。包括整数,字符串,浮点数,Python 对象等。Series 可以通过标签来定位。- DataFrame 是二维的带标签的数据结构。我们可以通过标签来定位数据。这是 NumPy 所没有的。下面节选实验楼《Pandas 百题大冲关》的基础部分50题,希望能够帮你快速掌握 Pandas 的基础使用。1. 导入 Pandas练习 Pandas 之前,首先需要导入 Pandas 模块,并约定简称为 pd
。