storm + kafka + zookeeper
Storm是Twitter开源的分布式实时大数据处理框架, Storm 是流示数据处理,是不均匀的,通过kafka +zookeeper将消息处理后均匀返回给Storm
kafka是一个分布式的,分区的消息(官方称之为commit log
)服务。它提供一个消息系统应该具备的功能,但是确有着独特的设计。
首先,让我们来看一下基础的消息(Message
)相关术语:
Topic: Kafka按照Topic
分类来维护消息
Producer: 我们将发布(publish
)消息到Topic的进程称之为生产者(producer
)
Consumer: 我们将订阅(subscribe
)Topic并且处理Topic中消息的进程称之为消费者(consumer
)
Broker: Kafka以集群的方式运行,集群中的每一台服务器称之为一个代理(broker
)。
因此,Storm的最佳数据源,实际上就是消息中间件。在本教程中,我们将使用阿里的RocketMq
作为数据源进行讲解。不过,在刚开始时,我们会使用模拟的外部数据源,来帮忙我们理解Topology的工作流程。等到熟悉之后,再使用RocketMq作为外部数据源。
转载自:http://www.tianshouzhi.com/
原文博主写的很好 ,这里只是方便自己记忆 ,不做任何用处