Uncertainty-aware visual analytics for exploring human behaviors from heterogeneous spatial temporal

论文传送门

作者

北京大学机器感知与智能教育部重点实验室

  • Siming Chen
  • Xiaoru Yuan

奇虎360

  • Zuchao Wang

悉尼科技大学

  • Jie Liang

摘要

在分析人类行为时,我们需要从多个数据源构建人类行为,例如轨迹数据、交易数据、身份数据等。我们面临的问题是数据冲突、分辨率不同、数据缺失和冲突,这些问题共同导致了时空数据的不确定性。数据中的这种不确定性导致用于分析人的行为、模式和异常值的可视化分析任务的困难甚至失败。然而,传统的自动化方法不能解决这种复杂场景中的问题,在这种场景中,不确定和冲突的模式没有很好地定义。为了解决这些问题,我们提出了一种半自动的方法,供用户解决冲突和识别不确定性。总的来说,我们总结了五种类型的不确定性和解决方案来执行行为分析任务。结合不确定性感知方法,我们提出了一个可视化分析系统来分析人类行为,检测模式和发现异常值。来自 IEEE VAST 挑战赛 2014 数据集的案例研究证实了我们方法的有效性。

Introduction

面对异构数据,我们可以采用可视化分析来了解人们的行为,发现模式并检测异常事件。

结合不确定性感知方法,我们提出了一个可视化分析系统,用于从异构数据中支持人类时空行为分析。

在本文中,我们报告了我们在可视化空间数据分析中识别的不同类型的不确定性,并演示了我们如何使用半自动方法对其进行优化。一般来说,我们的方法是数据驱动的可靠性改进方法。

在整个工作中,我们使用了来自 IEEE VAST 挑战赛 2014 迷你挑战赛 2 的虚拟数据集。结合不确定性感知方法,我们提出的可视化分析系统能够总结一组人的一般运动模式,并帮助分析师检测异常事件,具有各种可视化视图和多个过滤器。

Contribution

  • 半自动不确定性细化方法: 我们总结归纳了五种常见的不确定性,并针对每种不确定性提出了新的解决方案。为了解决定义不明确的不确定性问题,我们结合了用户的能力和算法方法,并允许人参与分析循环。
  • 感知不确定性的视觉分析系统: 我们开发了一个全面的视觉分析系统,结合了非确定性感知方法和多个协调的可视化视图,从而为理解人类行为和检测有趣的模式和异常值提供了完整的解决方案。

Related Work

行为分析通常侧重于模式提取,关系识别和人群聚类
以前在时空视觉分析方面的工作主要是针对规则密集采样的全球定位系统数据。我们提供了时空聚合和过滤技术,更重要的是,我们处理异构的时空数据,这些数据本身就具有冲突和不确定性。

在行为分析中,数据通常是不完美的,包含许多不确定性。数据中存在各种错误、数据丢失和冲突,在进行任何分析之前,都应该正确处理。

Uncertainty taxonomy

Uncertainty-aware visual analytics for exploring human behaviors from heterogeneous spatial temporal
这五种不确定性来源于对异构时空数据的分析。第一,信息缺失直接导致识别对象的信息缺失。第二,冲突表示异构数据集中存储了冲突的描述,以表示相同的已识别对象。例如,我们可能会发现同一个人同时出现在两个不同的地点的情况。这种不确定性是由数据冲突造成的。第三,不确定性中的粒度问题是数据集对象描述的分辨率不同。对于一个事件,我们可能同时拥有日级和秒级描述。第四,多重价值导致不确定性,因为缺乏区分价值的信息。例如,在一个位置,有多个商店。从具体位置来看,仅根据空间信息很难确定确切的商店。最后,错误降低了数据的可信度,并导致不确定性。例如,全球定位系统轨迹记录可能会因为记录的传输、编码和解码过程而出错。通过四个对象的五种类型的不确定性,我们用应用数据说明了代表性的不确定性,并在下面的部分给出了相应的解决方案。

Uncertainty illustration

在本节中,我们首先描述我们使用的数据。然后介绍了数据融合方法和可视化分析系统,这是不确定性处理和分类的基础。

  • POI Uncertainty
  • Temporal Uncertainty
  • Transaction Attribute Uncertainty
  • Location Uncertainty
  • Identity Uncertainty

Uncertainty-aware visual analytics for exploring human behaviors from heterogeneous spatial temporal
Uncertainty-aware visual analytics for exploring human behaviors from heterogeneous spatial temporal
Uncertainty-aware visual analytics for exploring human behaviors from heterogeneous spatial temporal
Uncertainty-aware visual analytics for exploring human behaviors from heterogeneous spatial temporal
Uncertainty-aware visual analytics for exploring human behaviors from heterogeneous spatial temporal
Uncertainty-aware visual analytics for exploring human behaviors from heterogeneous spatial temporal
Uncertainty-aware visual analytics for exploring human behaviors from heterogeneous spatial temporal
Uncertainty-aware visual analytics for exploring human behaviors from heterogeneous spatial temporal
Uncertainty-aware visual analytics for exploring human behaviors from heterogeneous spatial temporal
Uncertainty-aware visual analytics for exploring human behaviors from heterogeneous spatial temporal
Uncertainty-aware visual analytics for exploring human behaviors from heterogeneous spatial temporal

Visual analytics system

我们的视觉分析系统将不确定性感知方法与完全交互式的探索功能相结合。我们的系统可以使用户从异构的时空数据源中找到可靠的信息、检测模式和发现问题

Uncertainty-aware visual analytics for exploring human behaviors from heterogeneous spatial temporal

用户可以应用时空过滤来探索数据。地图视图显示了 poi 和 GPS 轨迹的位置(图 9a)。每个兴趣点由一个多边形表示,颜色编码兴趣点类别。每个 GPS 轨迹都表示为一条折线。用户可以在地图上应用空间过滤器来选择通过单个或多个区域的 GPS 轨迹。时间线视图显示了全球定位系统记录的时间分布(图 9b)。用户可以在时间轴上应用时间过滤器来选择单个或多个时间范围内的 GPS 轨迹。在探索中,用户可以在一个时间范围或时间段内过滤兴趣点,以进行进一步的模式分析。

实体视图显示了雇员的名单(图 9c)。用户可以直接选择列表中的人。详细事件视图显示了一名员工的整个事件序列(图 9d)。数据描述部分已经提到了该功能。用户可以首先分析事件序列中的基本日常模式。基于导出的规则模式,为每个单独的运动提供自动异常检测(图 7)。然而,由于人们会有诸如去超市或公园等特殊事件,自动方法会产生许多错误警报。这不一定是可疑事件。因此,我们使用户能够在空间、时间和事件视图中探索人的行为。基于异常提示,用户可以发现可疑事件,包括深夜外出、工作时间缺勤、卡被盗事件等。此外,我们支持多个人的行为比较,以获得更复杂的模式发现。事件时间线显示多个员工在选定时间范围内的事件子序列(图 9e)。主要用来比较/关联不同人的行为。结合其他观点,我们发现一些有趣的行为,如聚会、汽车-人与人之间的分享和其他不正常的关系等。

基于感知不确定性的视觉分析系统,用户可以通过交互式探索找到可靠的模式和事件。

System implementation

我们的系统是在客户-服务器架构下开发的。客户端用 HTML5/Javascript 构建,服务器端服务用 Python 和 MongoDB 实现。

Evaluation

我们从两个方面评估了我们提出的感知不确定性的可视化分析方法。首先,我们将我们的方法与纯计算方法进行比较,并说明我们的优势。其次,我们用一个案例来说明用户如何在处理不确定性后成功地找到事件。

我们讨论了我们的方法与假定的不确定性挖掘方法的比较部分。一开始,我们使用纯自动算法,发现有几个问题。特别是,对于某些情况,纯算法无法工作,因为它需要高水平的人类判断。

  • POI detection.
  • Temporal error and mismatching
  • Transaction attributes missing and conflicts
  • Location conflict, shift and errors
  • People information identity

case study - people behavior analysis

Uncertainty-aware visual analytics for exploring human behaviors from heterogeneous spatial temporal

Discussion

我们提出了一种感知不确定性的可视化分析方法来处理多个时空数据源。通过交互和算法方法,用户可以识别和细化数据的不确定性,由于定义不明确的不确定模式,这是一项具有挑战性的工作。这样的过程需要语义理解。例如,异常访问模式可以用大量的假警报来检测。一个人可能去超市不是那么规律,这可以被检测为异常行为。但是,在语义层面,去超市是很正常的行为。此外,对于具有多个数据源和属性的场景,这些算法不容易找到精确的解,这需要人的参与。在复杂的数据分析场景中,数据驱动的方法工作得更好,因为没有用于分析任务的现有模型。

尽管新颖而强大,但当前的不确定性感知方法仍然存在局限性。我们可以通过更直观的操作和自动匹配的方法来改进手动操作部分。它可以进一步提高我们方法的效率。在未来,我们还设想为不同的数据源测试我们的技术。应使用更大规模的数据集进一步评估系统的可扩展性。在现阶段,我们还没有做正式的用户研究。我们设想在未来进行一项用户研究。

我们学到的最大教训是,我们需要在不确定性下推理。我们不应假设数据中没有歧义、错误或冲突。我们认为,我们应该在意识到不确定性的情况下分析数据。另一方面,在识别不确定性时,我们需要了解不同的类型,并注意不确定性会在整个可视化分析管道中传播。

Conclusion

在这篇文章中,我们提出了一个不确定性感知的视觉分析系统,从异构时空数据中研究人类行为。我们总结了五种有代表性的不确定性类型及其细化方法。提出了一种数据驱动的方法,我们通过可视化界面充分利用人类的判断。通过多种来源的交叉验证,我们可以进一步提高细化结果的可靠性。基于细化结果,我们能够识别行为分析的模式和事件。