storm之流式计算

1.Storm是什么,为什么?

Apache Storm是一个免费的开源分布式实时计算系统---可靠,容错,实时,开源免费,可扩展,事务性。

  1. 适用场景

实时分析,在线机器学习,连续计算,分布式rpc,etl

  1. Topo

Spout,bolt,TopologyBuilder

            storm之流式计算

 

  1. 注意事项
  1. spout初始化在open 方法中完成
  2. Bolt初始化在prepare方法中完成
  3. Spout  ---》 bolt  ---》bolt  层数不宜太多
  4.  TOPOLOGY_MESSAGE_TIMEOUT_SECS  topo失效时间
  1. 核心组件逻辑

     Zeromq

  1. 项目应用
  1. 连续计算 流行分,热门标签,用户画像,优质库
  2. 实时分析  信息流推荐,猜你喜欢,相关推荐

Storm 官网: http://storm.apache.org