Pandas-可视化详解
目录
数据分析的结果不仅仅只是你来看的,更多的时候是给需求方或者老板来看的,为了更直观地看出结果,
数据可视化是必不可少的一个环节。这里带大家来看下一些常用的图形的画法。
数据准备
1 2 3 4 5 6 7 8 9 10 |
|
Pandas 的数据可视化的实现底层依赖于 matplotlib,所以画图时很多基础知识需要涉及到 matplotlib。
画图其实就是跟各种数字打交道,这里我们先给伪造一些数据。
1 2 3 4 5 6 7 8 9 10 |
|
1.折线图
生成数据之后,我们看下如何进行画图。其实非常简单的,调用 plot 方法就可以看到画图的结果了。默认情况下参数 kind="line" 表示图的类型为折线图。通过折线图可以看出数据随着某个变量的变化趋势。
1 |
|
1 |
|
2. 柱状图
通过柱状图可以对比多个值的差别。如果想要画出柱状图,可以将参数 kind 设置为 bar 或者 barh。
1 2 |
|
可以看到,设置 kind="bar" 之后,图形以索引为 x 轴, 列为 y 轴。
1 2 |
|
可以看到,设置 kind="barh" 之后,图形以列为 x 轴, 索引为 y 轴。同样我们也可以自己指定 x 轴和 y 轴。
1 2 3 |
|
#此外,如果想要生成堆叠条形图的haunted,可以设置参数 stacked=True。
1 2 |
|
3. 直方图
直方图是一种展示数据频数/率的特殊的柱状图。如果想要画出直方图,可以将参数 kind 设置为 hist。可以通过设置参数 bins 来改变 bin 的大小。
1 2 |
|
1 2 |
|
4.箱线图
通过箱线图可以展示出分位数,具体包括上四分位数、下四分位数、中位数以及上下5%的极值。如果想要画出箱线图,可以将参数 kind 设置为 box。
1 2 |
|
5.区域图
如果想要画出区域图,可以将参数 kind 设置为 area。默认情况下,区域图是堆积的,要生成堆积的区域图图,每列必须全部为正值或全为负值。
1 2 |
|
想要生成不堆积的区域图,设置参数 stacked=False 即可。
1 2 |
|
6.散点图
如果想要画出散点图,可以将参数 kind 设置为 scatter,同时需要指定 x 和 y。通过散点图可以探索变量之间的关系。
1 2 |
|
可以设置参数 c 作为列的名称以为每个点提供颜色。
1 2 |
|
#如果想要在单个轴上绘制多个列组,需要指定 ax。
1 2 3 |
|
7.饼图
如果想要画出饼图,可以将参数 kind 设置为 scatter。
1 2 3 |
|
1 2 |
|
如果想要自动计算出比例,可以设置参数 autopct。
1 2 |
|
8.六边形容器图
在绘制散点图时,如果数据过于密集,则无法单独绘制出每个点,这时候可以考虑 Hexbin 图。
其中,左边坐标表示的是值的分布,右边坐标表示的是数据量大小与颜色的对比。一个有用的关键字参数是 gridsize ; 它控制x方向的六边形数量,并且默认为100.较大的格栅意味着更多的较小的分区。
1 2 3 4 |
|
1 2 |
|