Kafka研究系列之时间轮TimerWheel
what
电商中经常会有些延时操作的业务,比如30分钟未支付则取消订单,kafka中消息到达broker后,写入延时队列,如果在超时时间内ISR列表节点没有全部同步消息,则返回客户端超时异常,因此时间轮的本质就是一个延时队列。
why
java中自带的延时队列DeleyQueue,底层使用优先队列PriorityQueue实现,本质是一个小顶堆,在入队时需要和父节点不断比较,如果比父节点大,则插入,如果比父节点小,则交换当前位置和父节点的位置,循环比较,直到比父节点大为止。因此时间复杂度为log(n), 不满足kafka性能需要,因此设计时间轮算法,时间复杂度为O(1);
how
- 当消息到达broker后,分区主节点会进行写入操作,然后将消费封装成任务指定超时时间放入时间轮中。
- 同时有1个timer不断推进时间,将过期的任务取出提交到线程池
- 如果在没有过期前,分区ISR列表完成数据同步,则取消任务。
具体实现:
数据结构:
写入:
- 根据过期时间计算在时间轮上的刻度值(桶), 如果超时时间大于当前时间轮的最大范围则创建父时间轮
- 将任务追加到双向链表中
- 如果延时队列中没有该桶,则放入
读出:
- timer从延时队列中取出双向链表
- 判断里面的任务是否过期,过期则提交到线程池执行
- 没过期降级到子时间轮中
- 同时更新时间轮中的当前时间