Pandas绘图(一):
转载自:https://blog.****.net/weixin_38168620/article/details/79797050
约定:
%matplotlib inline
-
import pandas as pd
-
import numpy as np
-
import matplotlib.pyplot as plt
图的用途+pandas绘图
一、折线图 Line Chart
- 折线图的用途
排列在工作表的列或行中的数据可以绘制到折线图中。折线图可以显示随时间(根据常用比例设置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势。
当有多个系列时,尤其适合使用折线图 — 对于一个系列,应该考虑使用类别图。如果有几个均匀分布的数值标签(尤其是年),也应该使用折线图。如果拥有的数值标签多于十个,请改用散点图。
- 类型1:单折线图
-
ts = pd.Series(np.random.randn(1000), index=pd.date_range('1/1/2000', periods=1000))
-
ts = ts.cumsum()
-
ts.plot();
注意:上面的图没有图例,标题;如果想对图进行完整,可用下面的语句:
ts.plot(color='',marker='',label='',title = '')
- 类型2:多折线图
-
df = pd.DataFrame(np.random.randn(1000, 4), index=pd.date_range('1/1/2000', periods=1000), columns=list('ABCD'))
-
df = df.cumsum()
-
df.plot();
二、柱状图 Bar Chart
- 柱状图的用途
柱状图(bar chart),是一种以长方形的长度为变量的表达图形的统计报告图,由一系列高度不等的纵向条纹表示数据分布的情况,用来比较两个或以上的价值(不同时间或者不同条件)。通常利用于较小的数据集分析。柱状图亦可横向排列,或用多维方式表达。
- 类型1:竖直柱状图
-
df2 = pd.DataFrame(np.random.rand(10, 4), columns=['a', 'b', 'c', 'd'])
-
df2.plot.bar();
- 类型2:叠加竖直柱状图
df2.plot.bar(stacked=True);
- 类型3:叠加水平柱状图
df2.plot.barh(stacked=True);
三、直方图 Histogram
- 直方图的用途
直方图(Histogram)又称质量分布图。是一种统计报告图,由一系列高度不等的纵向条纹或线段表示数据分布的情况。 一般用横轴表示数据类型(或等长区间),纵轴表示分布情况(落在该区间的频数)。
直方图的常见作用有以下三点:
(1)显示数据点波动的状态;
(2)较直观地传递有关过程状况的信息;
(3)通过研究质量波动状况之后,就能掌握过程的状况,从而确定在什么地方集中力量进行质量改进工作。
- 类型1:直方图
-
df3 = pd.DataFrame({'a': np.random.randn(1000) + 1, 'b': np.random.randn(1000)}, columns=['a', 'b'])
-
df3['a'].hist();
- 类型2:交叉直方图
df3.plot.hist(alpha=0.5,bins=20);
- 类型3:叠加直方图
df3.plot.hist(stacked=True, bins=20);
类型4:水平累计直方图
df3['a'].plot.hist(orientation='horizontal', cumulative=True);
* 类型5:多子图直方图
df3.hist(color='k', alpha=0.5, bins=50);