数据可视化 - 时序数据和比例型数据
学习笔记
可视化时序数据时,目标是看到什么已经成为过去,什么发生了变化,以及什么保持不变,相差程度又是多少。 From《数据之美》
时间序列的数据要求在同一数据列中数据之间具有可比性,也就是说各个数据的口径必须相同,数据可以是时期或者时点。对时间序列数据分析的目的一般是通过找出样本内时间序列的统计特性和发展规律性,构建时间序列模型,进行样本外预测。
比例型数据,我们进行可视化的目的,是为了寻找整体中的最大值、最小值、整体的构成分布、以及各部分之间的相对关系。
From 《如何优雅地选择数据图表:时序数据和比例型数据!》
比例型数据的可视化形式一般为饼图、环形图、百分比堆叠柱状图、百分比堆叠面积图和矩形树图。每种类型使用的场景有些许差别。
-
饼图
当构成整体的数据项较少时,采用饼图是一种不错的选择。对于饼图来说,建议扇区个数最大值在5~7个之间。当选项过多时,要么不要选择该种方式,要么将末位几项归类为【其他】,以避免图表杂乱无重点。 -
环形图
环形图中心部位是空的,可以放置标签、整体数值、平均数值或其他内容,通过各弧形的长度来衡量数值。它与饼图的情况类似,如果选项过多了,要采用同样的处理方法。 -
百分比堆叠柱状图
当比例数据中存在多个父系列,每个父系列又由多个子类构成,且各个系列的子类相同时,此时展示比例数据,可以采用百分比堆叠柱状图。各个系列对应的柱形条的高度是相同的,顶部刻度都为100%。 -
百分比堆叠面积图
当比例数据中存在多个父系列,且父系列的数据类型为时间,要分析父系列的各构成部分占比随时间的变化趋势,此时可以采用堆叠面积图来表示比例关系的变化。
- 矩形树图
矩形树图,是一种基于面积的可视化方法。外部矩形代表父级类别,内部矩形代表子类别。相比于其他表示比例型的数据,矩形树图更适合展示具有树状结构的数据。
作业
展示2018年全年的销售额整体趋势情况,以及不同品类销售额的发展趋势,应该用什么图表展示?
展示某日,该快递公司的寄件单的揽收时效分布及其占比情况,应该使用什么图表?