数据分析之数据可视化

目的:用图形的形式来表达数据。

统计图表类:

面积图:标准面积图、堆栈面积图、百分比面积图
PP图、误差分析图、箱线图、雷达图、金字塔图、矩阵图、漏斗图、帕累托图等
1.

2.柱状图:适用场合是二维数据集(每个数据点包括两个值x和y),但只有一个维度需要比较,用于显示一段时间内的数据变化或显示各项之间的比较情况。
优势:柱状图利用柱子的高度,反映数据的差异,肉眼对高度差异很敏感。
劣势:柱状图的局限在于只适用中小规模的数据集。
3.条形图
适用场景:显示各个项目之间的比较情况,和柱状图类似的作用;
优势:每个条都清晰表示数据,直观;
4.折线图
适用场景: 折线图适合二维的大数据集,还适合多个二维数据集的比较。
优势:容易反应出数据变化的趋势。
6.饼图(环图)
适用场景:显示各项的大小与各项总和的比例。适用简单的占比比例图,在不要求数据精细的情况适用。
优势:明确显示数据的比例情况,尤其合适渠道来源等场景。
劣势:肉眼对面积大小不敏感。
7.雷达图
适用场景:雷达图适用于多维数据(四维以上),且每个维度必须可以排序,数据点一般6个左右,太多的话辨别起来有困难。
优势:主要用来了解公司各项数据指标的变动情形及其好坏趋向。
劣势:理解成本较高。
10.散点图
适用场景:显示若干数据系列中各数值之间的关系,类似XY轴,判断两变量之间是否存在某种关联。散点图适用于三维数据集,但其中只有两维需要比较。
优势:对于处理值的分布和数据点的分簇,散点图都很理想。如果数据集中包含非常多的点,那么散点图便是最佳图表类型。
劣势:在点状图中显示多个序列看上去非常混乱。

鱼骨图(Ishikawa)
鱼骨图是一种发现问题“根本原因”的方法,它也可以称之为“因果图”。其特点是简捷实用,深入直观。它看上去有些象鱼骨,问题或缺陷(即后果)标在"鱼头"外。
鱼骨分析图:发现问题根本原因的分析方法。问题的特性总是受到一些因素的影响,通过头脑风暴找出这些因素,并将它们与特性值一起,按相互关联性整理绘制。
数据分析之数据可视化

5.各种数据地图(一共有6种类型)
适用场景:适用于有空间位置的数据集;
优劣势:特殊状况下使用,涉及行政区域;
(1)行政地图(面积图)
数据分析之数据可视化(2)行政地图(气泡图)
数据分析之数据可视化(3)地图图表:轨迹图
数据分析之数据可视化(4)地图图表:热力图
数据分析之数据可视化(5)地图图表:海点图
数据分析之数据可视化(6)地图图表:地图+柱状/饼图/条形
数据分析之数据可视化(7)地图图表:气泡图
数据分析之数据可视化注:制作地图图表需要经纬度信息,若只有地址信息,可以制作行政地图或者使用BDP的“地址转经纬度”功能。

8.漏斗图
适用场景:漏斗图适用于业务流程多的流程分析,显示各流程的转化率。
数据分析之数据可视化优势:在网站分析中,通常用于转化率比较,它不仅能展示用户从进入网站到实现购买的最终转化率,还可以展示每个步骤的转化率,能够直观地发现和说明问题所在。
劣势:单一漏斗图无法评价网站某个关键流程中各步骤转化率的好坏。
9.词云
适用场景: 显示词频,可以用来做一些用户画像、用户标签的工作。
标签云(词云):由出现频率较高的词或标签排列而成,主要用于数据挖掘。

数据分析之数据可视化
优势:很酷炫、很直观的图表。劣势:使用场景单一,一般用来做词频。

11.面积图
适用场景:强调数量随时间而变化的程度,也可用于引起人们对总值趋势的注意。
数据分析之数据可视化12.指标卡
适用场景:显示某个数据结果&同环比数据。
优势:适用场景很多,很直观告诉看图者数据的最终结果,一般是昨天、上周等,还可以看不同时间维度的同环比情况。
劣势:只是单一的数据展示,最多有同环比,但是不能对比其他数据。
13.计量图
适用场景:一般用来显示项目的完成进度。

数据分析之数据可视化优势:很直观展示项目的进度情况,类似于进度条。
劣势:表达效果很明确,数据场景比较单一。
14.瀑布图
适用场景:采用绝对值与相对值结合的方式,适用于表达数个特定数值之间的数量变化关系,最终展示一个累计值。
优势:展示两个数据点之间的演变过程,还可以展示数据是如何累计的。
劣势:没有柱状图、条形图的使用场景多。
15.桑基图
适用场景:一种特定类型的流程图,始末端的分支宽度总各相等,一个数据从始至终的流程很清晰,图中延伸的分支的宽度对应数据流量的大小,通常应用于能源、材料成分、金融等数据的可视化分析。
数据分析之数据可视化16.旭日图
适用场景:旭日图可以表达清晰的层级和归属关系,以父子层次结构来显示数据构成情况,旭日图能便于细分溯源分析数据,真正了解数据的具体构成。
数据分析之数据可视化优势:分层看数据很直观,逐层下钻看数据。
17.树图
适用场景:和旭日图类似;
数据分析之数据可视化18.双轴图
适用场景:柱状图+折线图的结合,适用情况很多,数据走势、数据同环比对比等情况都能适用。
优势:特别通用,是柱状图+折线图的结合,图表很直观。
数据分析之数据可视化

QQ图:二元分位数分析。斜率为标准差,截距为均值。
数据分析之数据可视化
QQ图的作用
用于直观验证一组数据是否来自某个分布,或者验证某两组数据是否来自同一(族)分布。在教学和软件中常用的是检验数据是否来自于正态分布。

茎叶图:数据首位(根据情况选定位数)作为茎,数据末尾作为叶。
数据分析之数据可视化
柏拉图(排列图)

排列图是分析和寻找影响质量主原因素的一种工具,其形式用双直角坐标图,左边纵坐标表示频数(如件数金额等),右边纵坐标表示频率(如百分比表示)。分折线表示累积频率,横坐标表示影响质量的各项因素,按影响程度的大小(即出现频数多少)从左向右排列。通过对排列图的观察分析可抓住影响质量的主原因素。

P_P图:反映变量的积累比例与指定分布的积累比例的关系图,当数据点呈线性分布的时候,观测样本越趋近给定分布。
数据分析之数据可视化误差分析图:分为系统误差和随机误差,衡量观测的精确度(包括测量的准确度和模型选取是否合理)。根据实际情况绘图即可。
数据分析之数据可视化残差分析图:表征取样的合理性,即样本是否具有代表性。
数据分析之数据可视化数据分析之数据可视化数据分析之数据可视化
概率分布图:表述随机变量取值的概率规律,常用的如正态分布、指数分布等。

数据分析之数据可视化漏斗模型(三角图):一般表述转化率(如营销客户转化),由上而下代表不同层级,转化率逐级降低并形成漏斗形状。
金字塔模型:不同层次依然由上而下分布,但处于上层的是重要的(或数量较少)的层次,并按重要性(或数量)逐级递减(递增)。
等高线图:有二维、三维等高线图。在数据分析中,高度表示为该点的数量或出现次数,该指标相同则在一条环线(或高度)处。
数据分析之数据可视化数据分析之数据可视化雷达图:即将一个样本的各项指标所得的数字或比率,就其比较重要的指标集中划在一个圆形的图表上,来表现一个样本各项指标重要比率的情况,使用者能一目了然的了解样本各项数据的变动情形及其好坏趋向。
数据分析之数据可视化南丁格尔玫瑰图:一种圆形的直方图,更易于观察,更加美观。
数据分析之数据可视化5W1H分析图:思考分析图,What(要完成什么任务?有哪些要点难点?) how (怎样完成该任务?用哪些方法技术?)where (何地完成?)when(何时完成) who(何人完成?) why(为什么要这么做?评估检验)。可以提高任务效率,简化任务步骤。

树状图:简单树状图、放射树状图。树图是一种流行的利用包含关系表达层次化数据的可视化方法。从一个项目出发,展开两个或两个以上分支,然后从每一个分支再继续展开,依此类推。有助于思维从一般到具体的逐步转化。树图是研究多元目标问题的一般工具。

其中,放射树状图为圆环形,中心为节点,放射端为叶,数据的度量为射线长度。

算法流程图:设计算法是程序设计的核心。为了表示一个算法,可以用不同的方法。常用的有自然语言,流程图,伪代码,PAD图等。这其中以特定的图形符号加上说明,表示算法的图,称为算法流程图。算法流程图包括传统流程图和结构流程图两种。

绘制工具有Visio。
数据分析之数据可视化思维导图:思维导图是一种将思维形象化的方法。我们知道放射性思考是人类大脑的自然思考方式,每一种进入大脑的资料,不论是感觉、记忆或是想法——包括文字、数字、符码、香气、食物、线条、颜色、意象、节奏、音符等,都可以成为一个思考中心,并由此中心向外发散出成千上万的关节点,每一个关节点代表与中心主题的一个连结,而每一个连结又可以成为另一个中心主题,再向外发散出成千上万的关节点,呈现出放射性立体结构,而这些关节的连结可以视为您的记忆,就如同大脑中的神经元一样互相连接,也就是您的个人数据库。