Co-Bridges: Pair-wise Visual Connection and Comparison for Multi-item Data Streams

论文传送门

作者

复旦大学

  • Siming Chen

德国弗朗霍夫智能分析与信息系统研究所

  • Natalia Andrienko
  • Gennady Andrienko

天津大学

  • Jie Li

北京大学

  • Xiaoru Yuan

摘要

在各个领域中,存在着丰富的各类多项目数据流或序列,如新闻、社交媒体文本流、基因序列、体育赛事等。在数据分析中,比较是一项重要而普遍的任务。为了比较涉及多个条目的数据流(例如,文本中的单词,动作序列中的演员或动作类型,行程中的访问地点等),我们提出了Co-Bridges,这是一种涉及连接和比较技术的视觉设计,可以揭示两个流之间的相似性和差异。Co-Bridges使用河和桥的比喻,河的两边代表数据流,桥连接时间上或顺序上对齐的流段。在各种项目的参与方面,这些部分之间的共性和差异显示在桥梁上。交互式查询工具支持为有重点的探索选择特定的流子集。可视化支持定性的(常见的和不同的项目)和定量的(流量,项目参与的数量)比较。我们进一步提出了比较的比较,在这种比较中,对应于不同选择的两个或多个Co-Bridges被并列在一起。我们测试了Co-Bridges在不同领域的适用性,包括社交媒体文本流和体育赛事序列。我们对用户理解和使用Co-Bridges的能力进行评估。结果证实,Co-Bridges在广泛的应用中是有效的支持成对视觉比较。

Introduction

Co-Bridges: Pair-wise Visual Connection and Comparison for Multi-item Data Streams
Challenges:

  • 每个数据流本身是一个复杂的动态现象,涉及不同的项目,因此不容易比较两个这样的流
  • 如何为比较生成一个信息丰富的视觉摘要来传达相似性和动态模式的差异

Contributions:

  • 一种新的成对视觉比较的可视化隐喻
  • 子流选择和探索性操作(比较比较)的交互技术
  • 不同应用的通用性

Related Work

  • Data Stream Visual Analytics
  • Visual Metaphors in Visual Analytics
  • Visual Comparison

Overview

Comparison Elements

  • 数据流动态比较
  • 项目比较
  • 比较比较

Comparison Challenges

  • 项目集的基数很高,因此很难全面查看完整的流。
  • 关于河流流量、不同项目的存在及其频率或数量的数据的动态特征
  • 子流对的比较,要求每对中相似和不同及其动态的紧凑表示

Comparison Strategy

  • 按顺序扫描并向下钻取
  • 基于属性迭代选择子集
  • 了解对比概况

Co-Bridges: Visualisation Design

Co-Bridges: Pair-wise Visual Connection and Comparison for Multi-item Data Streams
主题河隐喻

  • 河岸:可视化和比较两条河流的数字动态特征
  • 桥梁:可视化和比较多项目特征。
  • 视觉摘要:为了支持比较的比较,几个Co-Bridges并排布置成小型多视图

参数设置

  • 时间粒度
  • 提取项目的数量
  • 可见标签的数量
  • 颜色的选择

整体布局的替代方案
Co-Bridges: Pair-wise Visual Connection and Comparison for Multi-item Data Streams
Co-Bridges: Pair-wise Visual Connection and Comparison for Multi-item Data Streams

  • 整体布局
  • 逐项比较
    • 并列
    • 叠加
    • 显式编码

We conclude that the design of Co-Bridges is more suitable for our purposes than the two-level design alternatives.

Interactive Visual Comparison

在这一节中,我们提出了一个通过Co-Bridges进行交互式视觉比较的工作流程。
Co-Bridges: Pair-wise Visual Connection and Comparison for Multi-item Data Streams
Co-Bridges: Pair-wise Visual Connection and Comparison for Multi-item Data Streams

Generalizatino Study

Co-Bridges: Pair-wise Visual Connection and Comparison for Multi-item Data Streams

Co-Bridges: Pair-wise Visual Connection and Comparison for Multi-item Data Streams

User Evaluation

Co-Bridges: Pair-wise Visual Connection and Comparison for Multi-item Data Streams
Co-Bridges: Pair-wise Visual Connection and Comparison for Multi-item Data Streams

Overall Discussion and Conclusion

我们已经构思和开发了Co-Bridges,作为一种通用的、广泛适用的视觉比较方法。我们以一般的、与领域无关的术语介绍了这种方法,并在两个完全不同的领域进行了测试。我们有几个将Co-Bridges应用于新数据集的建议。首先,选择不同类型的元素进行比较,使应用范围更加广泛。例如,在推特数据集中,我们可以比较与不同用户相关的数据、来自文本的不同关键词、不同的标签、通过主题建模提取的不同主题,或者不同时期产生的同一用户的流,或者不同时期不同用户的事件流(例如,奥巴马和特朗普在各自竞选期间产生的文本)。这也是我们尽可能笼统地定义Co-Bridges的动机。其次,河流设计原则上适用于动态河流与随时间出现的新数据的比较。第三,Co-Bridges可以应用于各种数据处理和分析方
法的结果,如实体识别、主题建模、事件提取等。

Co-Bridges的一个普遍限制是关于不同项目数量的可伸缩性。当前的解决方案是显示最突出的项目,并允
许灵活选择以查看更多细节。将来,我们还将考虑在水平维度上提供进一步的语义放大。