flink window
窗口分类可以分成:
1)翻滚窗口(Tumbling Window,无重叠)
2)滚动窗口(Sliding Window,有重叠)
3)会话窗口(Session Window,活动间隙)
窗口可以是时间驱动的(Time Window,例如:每30秒钟),也可以是数据驱动的(Count Window,例如:每一百个元素)。
raw data stream 代表用户的购买行为流,圈中的数字代表该用户本次购买的商品个数,事件是按时间分布的,所以可以看出事件之间是有time gap的。
Flink 提出了三种时间的概念:
1)event time(事件时间:事件发生时的时间)
2)ingestion time(摄取时间:事件进入流处理系统的时间)
3)processing time(处理时间:消息被计算处理的时间)。
Tumbling Time Window
翻滚窗口能将数据流切分成不重叠的窗口,每一个事件只能属于一个窗口。
Sliding Time Window
需要的窗口是不间断的,需要平滑地进行窗口聚合。一个元素可以对应多个窗口。
参考:https://blog.****.net/wwwxxdddx/article/details/51706900