Time Series Segmentation through Automatic Feauture Learning
题目:《Time Series Segmentation through Automatic Feauture Learning》
时间:2018/1
简介:
这是一篇由IBM Research和普林顿大学几个reasearcher写的paper。很久之前老师就推荐给我了,最近有时间看完了,所以整理下。
这篇paper主要是针对时间序列的划分进行了探讨,用到的主要技术就是Deep Learning。整个方法和模型的框架并不复杂,而且还有较高的实用性。
应用技术:
ChangePoint的检测无论是进行聚类还是将连续状态转换为离散状态时都是一个基础而又极为重要的过程。
文中提出了一个breakpoint的概念,意为是人类专家进行对序列划分的changpoint。传统的检验ChangePoint的方法一般都是statistics-based,通过概率的角度对边界进行划分。而文中的方法则更偏向从更细微或者其他的维度的划分。
文中主要用到了Deep Learning 中的AutoEncoder算法。
模型框架:
1、先是通过人为指定一个time window,图中展示了具有三个channel的数据,类似声音或者其他类型数据。
2、然后核心就是AE模型,AE常用来作为DL参数的初始化以及对数据的降维处理。这里将它作为对数据维度的一个转换(也可以称为features extraction),并通过这个新的维度来计算新的维度中的feature中t与t+1 timestap的距离,这里用到了欧式距离的计算方法。
3、通过这个local-maximum distance(对应下图中的peak)来确定breakpoint。
4、最后整体进行bp更新。
之后文中还对比了其他的window size的区别以及与其他方法的对比实验。