5. 数据可视化的流程与框架
本文是对浙江大学的陈为老师所讲授的可视化导论课程的笔记。
数据可视化的流程与框架
1. 可视化基本流程
数据可视化,就是用图形化的手段,处理数据,并发现数据中潜在的模式。
数据可视化的流程:
- 数据获取
- 数据处理
- 任务分析
- 数据可视化
- 可视化分析
2. 可视化的框架
如何、为何、用何 可视化实现数据分析
可视化流程:是以数据流向为主线,包括数据采集、数据处理和变换、可视化映射和用户感知。
可视化交互:可视化过程中,用户控制修改数据采集、数据处理和变换、可视化映射各模块而产生新的可视化结果,并反馈给用户。
数据采集:传感器采样,调查记录,模拟计算等方式采集。数据采集直接决定了数据的格式、维度、尺寸、分辨率和精确度等重要性质,并在很大程度上决定了可视化结果的质量。
可视化映射:核心!
用户感知:从数据可视化结果中提取信息、知识和灵感。
可视化:从数据总探索新的假设,证实相关假设与数据是否吻合,帮助专家展示数据中的信息。
Haber和McNabb提出的泛可视化流水线:常应用于科学计算可视化系统中
Card, Mackinlay 和Shneiderman 描述的信息可视化流程模型:
可视分析:
结合可视化和数据挖掘的分析模式,以视觉感知为基本通道,通过可视化和交互界面,将人的知识或经验,融入到数据分析和推理决策过程中,以迭代求精的方式将数据复杂度降低到人类和计算机可以处理的范围,获取有效知识。
可视化学者 Tamarq Munzner 提出的一个可视分析模型:
将可视化的框架自顶向下分成四个层次:
- 领域。 目标用户是谁
-
问题抽象。 将特定领域问题转换为可视化的语言描述的问题
(1) What 要展示什么数据? 数据抽象
(2) Why 为什么用户看这些? 任务抽象 -
可视化形式。 How 如何呈现
(1) 视觉编码形式:如何画图
(2) 用户交互形式:如何操作 - 算法。 高效率的计算(来最终得到可视化)
理解 What Why How 的内涵
-
What can be visualized? 数据、数据集合属性
数据型类型 Dataset Types:- 表格 Table
- 网络 Network
- 场 Field
- 地理 Geometry
属性类型 Attribute Types
- 类别型 Gategorical
- 有序型 Ordered:又分为顺序型Ordinal 和 数量型Ordinal
-
Why people are using vis? 理解用户分析行为与分析目标
分析行为 Actions:- 分析 Analyze :利用数据并产生额外数据
- 搜索 Search:查找,定位,浏览,探索
- 查询 Query:识别,比较,概述
分析目标:
- 适用所有数据 All Data:分析趋势、异常、特征
- 使用于数据属性的 Attributes
- 针对网络数据 Network Data
- 针对空间数据 Spatial Data
-
How to design vis idiam?
编码数据、操作视图、多方面呈现和减少被可视化的数据。