读大型网站系统与java中间件实践总结
CAP理论
C:Consistency,一致性
A:Availability,可用性
P:partition tolerance,容错性
解释如下:
2000年,Eric Brewer教授指出了著名的CAP理论,后来Seth Gilbert 和 Nancy lynch两人证明了CAP理论的正确性。CAP(Consistency,Availability,partitiontolerance)理论告诉我们,一个分布式系统不可能满足一致性,可用性和分区容错性这三个需求,最多只能同时满足两个。
三者无法同时兼顾:关系型数据库ACID模型拥有高一致性+可用性,
现在分布式系统中,一般取AP放弃C也就是一致性,一致性分为 强一致性和最终一致性。通常使用base模型。
BASE理论
BASE模型反ACID模型,牺牲高一致性
Basically Availbale基本可用
Soft state软状态,允许有一段时间不同步。
Eventually consistent最终一致。
最终一致的实现:
说到最终一致的实现,不得不提两阶段提交。
两阶段提交与传统的不是commit 或者rollback,多了一个prepare的过程。
Hash一致性算法:
Hash一致性算法的使用场景体现在分布式系统的多节点数据路由方面。
路由的目的就是对数据进行分类(例如分库,分表存储)存储,查询的时候同样适用,传统的取模等算法,具有扩容带来的缺点。
Hash一致性原理:假设数据通过一个字段或者几个字段的算法,路由到2^32次方的hash环上,这样每个节点均匀的管理者数据,假设扩容,在两个节点之间插入一个几点,这样影响的范围就经可能的被缩小。
但是这样会带来一个问题 ,就是负载均衡的问题。通过把上述hash环的物理节点变成虚拟几点,每一个物理节点对应数个虚拟节点,当增加一台设备的时候,产生的数个虚拟节点均匀的插入hash环中,这样把影响的数据范围,均匀的分摊在多个物理节点上,解决了负载均衡的问题。