storm之流式计算
1.Storm是什么,为什么?
Apache Storm是一个免费的开源分布式实时计算系统。---可靠,容错,实时,开源免费,可扩展,事务性。
- 适用场景
实时分析,在线机器学习,连续计算,分布式rpc,etl
- Topo
Spout,bolt,TopologyBuilder
- 注意事项
- spout初始化在open 方法中完成
- Bolt初始化在prepare方法中完成
- Spout ---》 bolt ---》bolt 层数不宜太多
- TOPOLOGY_MESSAGE_TIMEOUT_SECS topo失效时间
- 核心组件逻辑
Zeromq
- 项目应用
- 连续计算 流行分,热门标签,用户画像,优质库
- 实时分析 信息流推荐,猜你喜欢,相关推荐
Storm 官网: http://storm.apache.org