LVS原理详解

LVS(Linux Virtual Server),Linux的虚拟服务器。

LVS集群采用三层结构:

a.负载调度器(load balancer),主要负责将客户的请求发送到一组服务器上,而客户认为服务是来自一个IP地址(我们称之为虚拟IP地址)。

b.服务器池(server pool),是一组真正处理客户请求的服务器,常见的有WEB、MAIL、DNS和FTP等。

c.共享存储(shared storage),为服务器池提供一个共享的存储区,使得地址池拥有相同的内容,提供相同的服务。

•运行模式
NAT(Network Address Translation)模式

IP TUNNEL(IP隧道)模式

Direct Routing(直接路由模式)

•模式详解:

NAT用法本来是因为网络IP地址不足而把内部保留IP地址通过映射转换成公网地址的一种上网方式(原地址NAT)。如果把NAT的过程稍微变化,就可以成为负载均衡的一种方式。原理其实就是把从客户端发来的IP包的IP头目的地址在DR上换成其中一台REAL SERVER的IP地址并发至此REAL SERVER,而REAL SERVER则在处理完成后把数据经过DR主机发回给客户端,DR在这个时候再把数据包的原IP地址改为DR接口上的IP地址即可。期间,无论是进来的流 量,还是出去的流量,都必须经过DR。

LVS原理详解

IP TUNNEL(IP隧道)模式则类似于v*n的方式,使用网络分层的原理, 在从客户端发来的数据包的基础上,封装一个新的IP头标记(不完整的IP头,只有目的IP部)发给REAL SERVER,REAL SERVER收到后,先把DR发过来的数据包的头给解开,还原其数据包原样,处理后,直接返回给客户端,而不需要再经过DR。需要注意的是,由于REAL SERVER需要对DR发过来的数据包进行还原,也就是说必须支持IP TUNNEL协议。所以,在REAL SERVER的内核中,必须编译支持IP TUNNEL这个选项。

LVS原理详解

Direct Routing直接路由模式比较特别,很难说和什么方面相似,前2种模式基本上都是工作在网络层上(三层),而直接路由模式则应该是工作在数据链路层上(二层)。其原理 为,DR和REAL SERVER都使用同一个IP对外服务。但只有DR对ARP请求进行响应,所有REAL SERVER对本身这个IP的ARP请求保持静默。也就是说,网关会把对这个服务IP的请求全部定向给DR,而DR收到数据包后根据调度算法,找出对应的 REAL SERVER,把目的MAC地址改为REAL SERVER的MAC并发给这台REAL SERVER。这时REAL SERVER收到这个数据包,则等于直接从客户端收到这个数据包无异,处理后直接返回给客户端。由于DR要对二层包头进行改换,所以DR和REAL SERVER之间必须在一个广播域。

LVS原理详解

•各运行模式优缺点

NAT模式
优:节省Internet地址
缺:进出流量都需经LVS,扩展性有限。

IP TUNNEL(IP隧道)模式
优:只负责请求分发,应答不经LVS。
缺:需要做Internet映射;服务器需支持IP Tunnel 协议。

Direct Routing(直接路由)模式
优:只负责请求分发,应答不经LVS。
缺:需要做Internet映射。

•调度算法

1.轮询调度(Round-RobinScheduling)

调度器通过“轮询”调度算法将外部请求按顺序轮流分配到集群中的realserver服务器上,它均等地对待每一台服务器,而不管服务器上实际的连接数和系统负载。


2.加权轮询调度(WeightedRound-RobinScheduling)

调度器通过“加权轮询”调度算法根据realserver服务器的不同处理能力来调度访问请求,这样可以保证处理能力强的服务器处理更多的访问流量,调度器可以自动问询realserver服务器的负载情况,并动态地调整其权值。


3.最小连接调度(Least-ConnectionScheduling)
调度器通过“最少连接”调度算法动态地将网络请求调度到已建立的链接数最少的服务器上。如果集群系统的真实服务器具有相近的系统性能,采用“最小连接”调度算法可以较好地均衡负载。

4.加权最小连接调度(WeightedLeast-ConnectionScheduling)

在集群系统中的服务器性能差异较大的情况下,调度器采用“加权最少链接”调度算法优化负载均衡性能,具有较高权值的服务器将承受较大比例的活动连接负载。调度器可以自动问询realserver服务器的负载情况,并动态地调整其权值。


5.基于局部性的最少链接(Locality-BasedLeastConnectionsScheduling)

基于局部性的最少链接“调度算法是针对目标IP地址的负载均衡,目前主要用于Cache集群系统。该算法根据请求的目标IP地址找出该目标IP地址最近使用的服务器,若该服务器是可用的且没有超载,将请求发送到该服务器;若服务器不存在,或者该服务器超载且有服务器处于一半的工作负载,则用”最少链接“的原则选出一个可用的服务器,将请求发送到该服务器。


6.带复制的基于局部性最少链接(Locality-BasedLeastConnectionswithReplicationScheduling)

带复制的基于局部性最少链接“调度算法也是针对目标IP地址的负载均衡,目前主要用于Cache集群系统?它与LBLC算法的不同之处是它要维护从一个目标IP地址到一组服务器的映射,而LBLC算法维护从一个目标IP地址到一台服务器的映射。该算法根据请求的目标IP地址找出该目标IP地址对应的服务器组,按”最小连接“原则从服务器组中选出一台服务器,若服务器没有超载,将请求发送到该服务器,若服务器超载;则按”最小连接“原则从这个集群中选出一台服务器,将该服务器加入到服务器组中,将请求发送到该服务器。同时,当该服务器组有一段时间没有被修改,将最忙的服务器从服务器组中删除,以降低复制的程度。


7.目标地址散列调度(DestinationHashingScheduling)

目标地址散列"调度算法根据请求的目标IP地址,作为散列键(HashKey)从静态分配的散列表找出对应的服务器,若该服务器是可用的且未超载,将请求发送到该服务器,否则返回空。


8.源地址散列调度(SourceHashingScheduling)

源地址散列“调度算法根据请求的源IP地址,作为散列键(HashKey)从静态分配的散列表找出对应的服务器,若该服务器是可用的且未超载,将请求发送到该服务器,否则返回空。


•应用场景

LVS原理详解