Kafka结构以及各个组件的形象理解以及内部执行机制

1.Apache Kafka 是分布式发布-订阅消息系统（消息中间件），是一种快速、可扩展、分区的和可复制的提交日志服务。

2.一个特别好的例子：
举个例子，生产者消费者，生产者生产鸡蛋，消费者消费鸡蛋，生产者生产一个鸡蛋，消费者就消费一个鸡蛋，假设消费者消费鸡蛋的时候噎住了（系统宕机了），生产者还在生产鸡蛋，那新生产的鸡蛋就丢失了。再比如生产者很强劲（大交易量的情况），生产者1 秒钟生产100 个鸡蛋，消费者1 秒钟只能吃50 个鸡蛋，那要不了一会，消费者就吃不消了
（消息堵塞，最终导致系统超时），消费者拒绝再吃了，”鸡蛋“又丢失了，这个时候我们
放个篮子在它们中间，生产出来的鸡蛋都放到篮子里，消费者去篮子里拿鸡蛋，这样鸡蛋就不会丢失了，都在篮子里，而这个篮子就是”Kafka“。
鸡蛋其实就是“数据流”，系统之间的交互都是通过“数据流”来传输的（就是tcp、http
什么的），也称为报文，也叫“消息”。
消息队列满了，其实就是篮子满了，”鸡蛋“ 放不下了，那赶紧多放几个篮子，其实就是
Kafka 的扩容。Kafka 就是例子中的"篮子"。

3.Kafka术语：
1)Broker:
Kafka 集群包含一个或多个服务器，这种服务器被称为 broker
2)Topic:
每条发布到 Kafka 集群的消息都有一个类别，这个类别被称为 Topic。（物
理上不同 Topic 的消息分开存储，逻辑上一个 Topic 的消息虽然保存于一个或多个 broker 上但用户只需指定消息的 Topic 即可生产或消费数据而不必关心数据存于何处）
3)Partition:
Partition 是物理上的概念，每个 Topic 包含一个或多个 Partition.
4)Producer:
负责发布消息到 Kafka broker
5)Consumer:
消息消费者，向 Kafka broker 读取消息的客户端
6)Consumer Group:
每个 Consumer 属于一个特定的 Consumer Group（可为每个 Consumer
指定 group name，若不指定 group name 则属于默认的 group）
7)replic:
partition 的副本，保障 partition 的高可用
8)leader:
replica 中的一个角色， producer 和 consumer 只跟 leader 交互
9)follower:
replica 中的一个角色，从 leader 中复制数据
10)controller:
Kafka 集群中的其中一个服务器，用来进行 leader election 以及各种
failover

4.自己理解：
 producer：生产者，就是它来生产“鸡蛋”的。
 consumer：消费者，生出的“鸡蛋”它来消费。
 topic：把它理解为标签，生产者每生产出来一个鸡蛋就贴上一个标签（topic），消费者可不是谁生产的“鸡蛋”都吃的，这样不同的生产者生产出来的“鸡蛋”，消费者就可以选择性的“吃”了。
 broker：就是篮子了。
如果从技术角度，topic标签实际就是队列，生产者把所有“鸡蛋（消息）”都放到对应的队列里了，消费者到指定的队列里取。

producer生产出来的数据放到kafka里面，kafka首先将它分为不同的topic，以供cinsumer消费查找，不同的topic里面又有很多分区，分区又会有很多的副本。副本里面就会有leader和follwer。leader对外提供读写服务，并且通过一种效率很高的方式传给follwer.

5. Kafka结构以及各个组件的形象理解以及内部执行机制

Kafka结构以及各个组件的形象理解以及内部执行机制

相关推荐