python数据可视三大库之pandas库(一:series类型快速上手)

这是继我的上一篇博客《环境安装血泪史之人工智能劝退篇(anaconda3+cuda10.2+cudnn7.6+tensorflow-gpu2.1.0)win10系统的gpu版》后的关于tensorflow2.0的学习前奏笔记,要学习机器学习建议先了解以下python有关数据分析的第三方库,这里的推荐课程 中国大学mooc 北京理工大学开设的python数据可视化教程,里面系统讲解了numpy,matplotlib以及pandas库,建议在学习课程前先安装anaconda。
这篇笔记是对mooc所讲matplotlib库的个人整理,资料来源于 中国大学mooc 北京理工大学开设的python数据可视化教程

pandas库的介绍

pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。

Pandas是Python第三方库,提供高性能易用数据类型和分析工具
import pandas as pd引入pandas库
Pandas基于NumPy实现,常与NumPy和Matplotlib一同使用

Series类型

由一组数据及与之相关的数据索引组成

创建方式

python列表

如图
python数据可视三大库之pandas库(一:series类型快速上手)

标量值

python数据可视三大库之pandas库(一:series类型快速上手)

字典

python数据可视三大库之pandas库(一:series类型快速上手)

字典的键就对应着索引

ndarray(numpy库)

python数据可视三大库之pandas库(一:series类型快速上手)

其他函数

python数据可视三大库之pandas库(一:series类型快速上手)
上述五种方式都可以轻松创建pandas的Series类型

索引——index自定义

series类型的索引标签可以自定义,例如列表a=[18,181,150],索引标签[年龄,身高,体重]
python数据可视三大库之pandas库(一:series类型快速上手)
还比如标量,通过标签表示多种意思
python数据可视三大库之pandas库(一:series类型快速上手)
标签可以从字典里进行选择操作,例如
python数据可视三大库之pandas库(一:series类型快速上手)
如上图series里的标签c,a,b会自动与字典里的c,a,b对应,而d则是多余出来的就被即为NaN

注意

python数据可视三大库之pandas库(一:series类型快速上手)
如果你对一组数据添加了自定义索引,那么展示出来的就是自定义索引,但是自动索引也存在
索引如果没有自定义,那么就会只有自动索引

series类型的基本操作

series类型包括index和values两种类型
series类型的操作类似于nadarray
series类型操作类似于python字典

操作示例

1.通过.index,展示出索引列表
python数据可视三大库之pandas库(一:series类型快速上手)
通过.values,展示值(ndarray类型)
python数据可视三大库之pandas库(一:series类型快速上手)

2.通过索引找出对应值
自定义索引和自动索引都可以,但是必须保证一致,不能混合使用
python数据可视三大库之pandas库(一:series类型快速上手)
python数据可视三大库之pandas库(一:series类型快速上手)

操作与ndarray类型相似

python数据可视三大库之pandas库(一:series类型快速上手)

操作示例

索引与切片
创建一个series类型变量
python数据可视三大库之pandas库(一:series类型快速上手)
自动索引的索引与切片
python数据可视三大库之pandas库(一:series类型快速上手)
自定义索引的索引和切片
python数据可视三大库之pandas库(一:series类型快速上手)
使用函数来进行索引和切片
python数据可视三大库之pandas库(一:series类型快速上手)

操作与python字典相似

python数据可视三大库之pandas库(一:series类型快速上手)

保留字in的操作(针对index的)返回布尔类型
python数据可视三大库之pandas库(一:series类型快速上手)
get()方法
python数据可视三大库之pandas库(一:series类型快速上手)

对齐操作
例如两个series类型,a+b,如果a和b中存在无法对应的索引则无法对应的索引返回NaN,对应的索引相加。还是刚刚的series b与一个新的series a相加
python数据可视三大库之pandas库(一:series类型快速上手)

series的name属性

series对象和索引都可以有一个名字存在.name属性中
python数据可视三大库之pandas库(一:series类型快速上手)

series对象可以随时修改即刻生效

下一篇是关于pandas库的DataFrame类型,资料来源于mooc北京理工大学嵩天老师的python数据可视化课程