3小时入门numpy,pandas,matplotlib

 

使用Python中的三个库可以优雅地进行数据分析,得到一只野生的Matlab,这三个库是numpy,pandas 和 matplotlib。

numpy是高性能科学计算和数据分析的基础包,其array多维数组拥有丰富的数据类型,基于向量化技术可以有效代替循环,代码简单速度极快。

以numpy为基础的pandas中的数据框dataframe集数据分析工具万象于一身,可以像array数组一样进行复杂计算,又可以像excel一样地操作数据,又可以像SQL一样地操作数据。

而matplotlib进一步以matlab风格实现了绘图功能。其强大的数据可视化能力可以让你的数据分析结果颜值倾城。

 

 

一、numpy 库

 

numpy提供了三种常用的对象,数组array、矩阵matrix和ufunc(universal function)。

 

1,创建array

 

3小时入门numpy,pandas,matplotlib

 

 

2,访问array元素

 

3小时入门numpy,pandas,matplotlib

 

3,array运算

 

3小时入门numpy,pandas,matplotlib

 

4,使用matrix运算

 

3小时入门numpy,pandas,matplotlib

 

5,使用ufunc对象

 

3小时入门numpy,pandas,matplotlib

 

二、pandas 库

 

pandas中的DataFrame是交互性最好在数据分析中使用最广泛的数据结构。

 

pandas 中常用的数据结构有:

(1)Series:一维数组,与Numpy中的一维array类似。

Series中只允许存储相同的数据类型。

(2)DataFrame:二维的表格型数据结构。

可以将DataFrame理解为Series的容器。

(3)Panel :三维的数组,可以理解为DataFrame的容器。

 

1,Series对象

3小时入门numpy,pandas,matplotlib

 

2,创建DataFrame对象

 

3小时入门numpy,pandas,matplotlib

 

3,从excel中读入DataFrame对象

 

3小时入门numpy,pandas,matplotlib

 

4,增加行

3小时入门numpy,pandas,matplotlib

5,删除行

 

3小时入门numpy,pandas,matplotlib

 

6,增加列

 

3小时入门numpy,pandas,matplotlib

7,删除列

 

3小时入门numpy,pandas,matplotlib

 

8,移动列

 

3小时入门numpy,pandas,matplotlib

 

9,排序

3小时入门numpy,pandas,matplotlib

 

10,拼接

 

3小时入门numpy,pandas,matplotlib

 

11,选取数据

 

有三种选取数据的方法:下标索引、标签索引、布尔索引。

 

3小时入门numpy,pandas,matplotlib

 

12,导出到csv文件或excel文件

 

3小时入门numpy,pandas,matplotlib

 

 

13,常用统计函数

 

3小时入门numpy,pandas,matplotlib

3小时入门numpy,pandas,matplotlib

3小时入门numpy,pandas,matplotlib

 

14,时间格式

 

3小时入门numpy,pandas,matplotlib

 

三,matplotlib 库

 

matplotlib 支持函数式绘图和面向对象绘图两种绘图方式。

函数式绘图方式与matlab风格一致,先用一条语句画出图像,然后用一系列函数去修饰。而面向对象绘图方式一般自上而下完成,先创建figure,然后再创建子图ax,然后绘制data,最后设计各种辅助元素 (包括 xaxis, yaxis, title, grid,legend, annotate 等 )。

 

1,折线图

3小时入门numpy,pandas,matplotlib

 

 

3小时入门numpy,pandas,matplotlib

3小时入门numpy,pandas,matplotlib

3小时入门numpy,pandas,matplotlib

3小时入门numpy,pandas,matplotlib

 

2,条形图

3小时入门numpy,pandas,matplotlib

3,柱形分布图

 

3小时入门numpy,pandas,matplotlib

4,散点图

3小时入门numpy,pandas,matplotlib

5,饼图

 

3小时入门numpy,pandas,matplotlib

 

 

6,绘制子图

 

3小时入门numpy,pandas,matplotlib

3小时入门numpy,pandas,matplotlib

 

Appendix:Ipython notebook 常用快捷键

 

  • Tab  对象补全

  • Shift + Tab 对象提示帮助

  • Ctrl + Enter 运行当前cell

  • Shift + Enter 运行当前cell,并选中下一个cell

  • Alt + Enter 运行当前cell,并在下方创建一个空的cell

  • Esc * M 切换成markdown输入状态

  • Esc * A 在上方插入cell

  •  Esc * B 在下方插入cell

3小时入门numpy,pandas,matplotlib