【雪花算法】----Twitter的分布式自增ID算法snowflake
前言
最近在搭建分布式集群,目前设计到了ID的生成策略,闲暇之余看了一下雪花算法,目前通过博客分享出来,希望大家一起学习,进步。
概述
Twitter的分布式雪花算法SnowFlake,经测试snowflake每秒能够产生26万个自增可排序的ID
1.Twitter的SnowFlake生成ID能够按照时间有序生成
2.SnowFlake算法生成id的结果是一个64bit大小的整数,为一个Long型(转换成字符串后长度最多19)
3.分布式系统内不会产生ID碰撞(由datacenter和workerId作区分)并且效率较高。
分布式系统中,有一些需要使用全局唯一ID的场景,生成ID的基本要求
1.在分布式的环境下必须全局且唯一。
2.一般都需要单调递增,因为一般唯一ID都会存到数据库,而Innodb的特性就是将内容存储在主键索引树上的叶子节点,而且是从左往右,递增的,所以考虑到数据库性能,一般生成的id,也最好是单调递增,为了防止ID冲突可以使用36位的UUID,但是UUID有一些缺点,首先他相对比较长,另外UUID一般是无序的。
结构
SnowFlake可以保证
所有生成的id按时间趋势递增
整个分布式系统不会产生重复的id(因为有datacenterId和workedrId来做区分)
源码
https://github.com/twitter-archive/snowflake
工程落地经验
- 糊涂工具包
https://github.com/looly/hutool - springboot整合雪花算法
优缺点
- 优点:
毫秒数在高位,自增序列在低位,整个ID都是趋势递增的。
不依赖数据库等第三方系统,以服务的方式部署,稳定性更高,生成ID的性能也是非常高的。
可以根据自身业务特性分配bit位,非常灵活。 - 缺点
依赖机器时钟,如果机器时钟回拨,会导致重复ID生成
在单机上是递增的,但是由于设计到分布式环境,每台机器上的时钟不可能完全同步,有时候会出现不适全局递增的情况(此缺点可以认为无所谓,一般分布式ID只要求趋势递增,并不会严格要求递增,90%的需求都只要求趋势递增)
友情链接:
- 百度开源的分布式唯一ID生成器UidGenerator
- Leaf—美团点评分布式ID生成系统