Storm 从入门到精通 第八讲 Storm Stream Grouping 7 种策略

Topology

一个实时计算应用程序逻辑上被封装在Topology对象中,类似Hadoop中的作业与作业不同的是, Topology会一直运行直到显式地杀死它

Storm中运行的一个实时应用程序,因为各个组件间的消息流动形成逻辑上的一个拓扑结构。

Storm 从入门到精通 第八讲 Storm Stream Grouping 7 种策略

一个 Topology是Spouts和Bolts组成的流程图,通过Stream Groupings将图中的 Spouts和Bolts连接起来,完成实时流业务逻辑处理

Stream Groupings:

在Storm中, 开发者可以为上游Spout/Bolt发射出的Tuples指定下游Bolt的哪个/哪些Task(s)来处理该Tuples。

为每个bolt指定应该接受哪个流作为输入,流分组定义了如何在bolt的任务直接进行分发。

即Stream Grouping,分组方式主要有以下7种

Shuffle Grouping 
None Grouping
Fields Grouping
All Grouping
Global Grouping
LocalOrShuffle Grouping
Direct Grouping