您的位置: 首页 > 文章 > 第二课：十分钟搞定Pandas

第二课：十分钟搞定Pandas

分类: 文章 • 2024-12-15 19:42:10

【十分钟搞定Pandas】

本文是对Pandas官方网站上《10 Minutes to pandas》的一个简单的翻译，原文在这里。这篇文章是对pandas的一个简单的介绍，详细的介绍请参考：Cookbook 。

第二课：十分钟搞定Pandas

习惯上，我们会按下面格式引入所需要的包：

第二课：十分钟搞定Pandas

一、创建对象

可以通过 Data Structure Intro Setion 来查看有关该节内容的详细信息。

1、可以通过传递一个list对象来创建一个Series，pandas会默认创建整型索引：

第二课：十分钟搞定Pandas

2、通过传递一个numpy array，时间索引以及列标签来创建一个DataFrame：

第二课：十分钟搞定Pandas

第二课：十分钟搞定Pandas

3、通过传递一个能够被转换成类似序列结构的字典对象来创建一个DataFrame：

第二课：十分钟搞定Pandas

第二课：十分钟搞定Pandas

4、查看不同列的数据类型：

第二课：十分钟搞定Pandas

二、查看数据

详情请参阅：Basics Section

1、查看frame中头部和尾部的行：

第二课：十分钟搞定Pandas

2、显示索引、列和底层的numpy数据：

第二课：十分钟搞定Pandas

3、 describe()函数对于数据的快速统计汇总：

第二课：十分钟搞定Pandas

4、对数据的转置：

第二课：十分钟搞定Pandas

5、按轴进行排序

第二课：十分钟搞定Pandas

6、按值进行排序

三、选择

虽虽然标准的Python/Numpy的选择和设置表达式都能够直接派上用场，但是作为工程使用的代码，我们推荐使用经过优化的pandas数据访问方式： .at, .iat, .loc, .iloc 和 .ix详情请参阅Indexing and Selecing Data 和 MultiIndex / Advanced Indexing。

l 获取

1、选择一个单独的列，这将会返回一个Series，等同于df.A：

第二课：十分钟搞定Pandas

2、通过[]进行选择，这将会对行进行切片

第二课：十分钟搞定Pandas

l 通过标签选择

1、使用标签来获取一个交叉的区域

第二课：十分钟搞定Pandas

2、通过标签来在多个轴上进行选择

第二课：十分钟搞定Pandas

3、标签切片

第二课：十分钟搞定Pandas

4、对于返回的对象进行维度缩减

第二课：十分钟搞定Pandas

5、获取一个标量

第二课：十分钟搞定Pandas

6、快速访问一个标量（与上一个方法等价）

第二课：十分钟搞定Pandas

l 通过位置选择

1、通过传递数值进行位置选择（选择的是行）

第二课：十分钟搞定Pandas

2、通过数值进行切片，与numpy/python中的情况类似

第二课：十分钟搞定Pandas

3、通过指定一个位置的列表，与numpy/python中的情况类似

第二课：十分钟搞定Pandas

4、对行进行切片

第二课：十分钟搞定Pandas

5、对列进行切片

第二课：十分钟搞定Pandas

6、获取特定的值

第二课：十分钟搞定Pandas

l 布尔索引

1、使用一个单独列的值来选择数据：

第二课：十分钟搞定Pandas

2、使用where操作来选择数据：

第二课：十分钟搞定Pandas

3、使用isin()方法来过滤：

第二课：十分钟搞定Pandas

第二课：十分钟搞定Pandas

l 设置

1、设置一个新的列：

第二课：十分钟搞定Pandas

第二课：十分钟搞定Pandas

2、通过标签设置新的值：

第二课：十分钟搞定Pandas

3、通过位置设置新的值：

第二课：十分钟搞定Pandas

4、通过一个numpy数组设置一组新值：

第二课：十分钟搞定Pandas

5、通过where操作来设置新的值，设置所有>0的值，取反值：

第二课：十分钟搞定Pandas

第二课：十分钟搞定Pandas

四、缺失值处理

在pandas中，使用np.nan来代替缺失值，这些值将默认不会包含在计算中，详情请参阅：Missing Data Section。

1、 reindex()方法可以对指定轴上的索引进行改变/增加/删除操作，这将返回原始数据的一个拷贝：

第二课：十分钟搞定Pandas

2、去掉包含缺失值的行：

第二课：十分钟搞定Pandas

3、对缺失值进行填充：

第二课：十分钟搞定Pandas

4、对数据进行布尔填充：

第二课：十分钟搞定Pandas