前言

在互联网应用中，随着站点对硬件性能、响应速度、服务稳定性、数据可靠性等要求越来越高，单台服务器力不从心。所以我们需要通过一些方法来解决这样的瓶颈。‘

最简单的方法就是使用价格昂贵的大、小型的主机；但这样在大多数企业中显然是不可取或者说不现实的。那么我们就需要通过多个普通服务器构建服务器群集。

LVS简介

何为LVS

LVS（Linux Virtual Server）即Linux虚拟服务器，是由章文嵩博士主导的开源负载均衡项目，目前LVS已经被集成到Linux内核模块中。该项目在Linux内核中实现了基于IP的数据请求负载均衡调度方案，其体系结构如图1所示，终端互联网用户从外部访问公司的外部负载均衡服务器，终端用户的Web请求会发送给LVS调度器，调度器根据自己预设的算法决定将该请求发送给后端的某台Web服务器，比如，轮询算法可以将外部的请求平均分发给后端的所有服务器，终端用户访问LVS调度器虽然会被转发到后端真实的服务器，但如果真实服务器连接的是相同的存储，提供的服务也是相同的服务，最终用户不管是访问哪台真实服务器，得到的服务内容都是一样的，整个集群对用户而言都是透明的。最后根据LVS工作模式的不同，真实服务器会选择不同的方式将用户需要的数据发送到终端用户，LVS工作模式分为NAT模式、TUN模式、以及DR模式。

LVS的构成

①从物理层面上讲，LVS的主要组成：

负载调度器(load balancer/ Director)，它是整个集群对外面的前端机，负责将客户的请求发送到一组服务器上执行，而客户认为服务是来自一个IP地址(我们可称之为虚拟IP地址)上的。
服务器池(server pool/ Realserver)，是一组真正执行客户请求的服务器，执行的服务一般有WEB、MAIL、FTP和DNS等。
共享存储(shared storage)，它为服务器池提供一个共享的存储区，这样很容易使得服务器池拥有相同的内容，提供相同的服务。
如下图所示：

注：一般为了实现高可用会使用两台以上的调度服务器，作为备份，提高安全性。

②从软件层面上讲，LVS 由2部分程序组成，包括 ipvs 和 ipvsadm。

1、ipvs(ip virtual server) ：工作在内核空间的一段代码，叫ipvs，是真正生效实现调度的代码。
2、ipvsadm ：另外一段是工作在用户空间，叫ipvsadm，负责为ipvs内核框架编写规则，定义谁是集群服务，而谁是后端真实的服务器(Real Server)，然后由内核代码实现真正的调度算法及功能。

LVS三种工作模式

1、基于NAT的LVS模式负载均衡

NAT（Network Address Translation）即网络地址转换，其作用是通过数据报头的修改，使得位于企业内部的私有IP地址可以访问外网，以及外部用户可以访问于公司内部的私有IP主机。

VS/NAT工作模式拓扑结构如图2所示，LVS负载调度器可以使用两块网卡配置不同的IP地址，eth0设置为私钥IP与内部网络通过交换设备相互连接，eth1设备为外网IP与外部网络联通。

第一步，用户通过互联网DNS服务器解析到公司负载均衡设备上面的外网地址，相对于真实服务器而言，LVS外网IP又称VIP（Virtual IP Address），用户通过访问VIP，即可连接后端的真实服务器（Real Server），而这一切对用户而言都是透明的，用户以为自己访问的就是真实服务器，但他并不知道自己访问的VIP仅仅是一个调度器，也不清楚后端的真实服务器到底在哪里、有多少真实服务器。
第二步，用户将请求发送至124.126.147.168，此时LVS将根据预设的算法选择后端的一台真实服务器（192.168.0.1~192.168.0.3），将数据请求包转发给真实服务器，并且在转发之前LVS会修改数据包中的目标地址以及目标端口，目标地址与目标端口将被修改为选出的真实服务器IP地址以及相应的端口。
第三步，真实的服务器将响应数据包返回给LVS调度器，调度器在得到响应的数据包后会将源地址和源端口修改为VIP及调度器相应的端口，修改完成后，由调度器将响应数据包发送回终端用户，另外，由于LVS调度器有一个连接Hash表，该表中会记录连接请求及转发信息，当同一个连接的下一个数据包发送给调度器时，从该Hash表中可以直接找到之前的连接记录，并根据记录信息选出相同的真实服务器及端口信息。

NAT模式详细说明：

1、client请求资源，当报文到达director时，源和目标IP是CIP-VIP，IPVS会强行修改目标地址为RIP，将报文从INPUT发向POSTROUTING，源和目标IP修改为CIP-RIP，RS验证目标地址是本地地址，则接受报文并处理请求。

2、RS响应请求，由于请求报文源IP是CIP，所以响应报文的目标IP是CIP；将响应报文发送给网关director后，director会通过SNAT将源IP修改为VIP，这样client才可以明确是响应它请求报文的数据包。

特点：

director与RS必须在同一个局域网呢
RS的网关必须指向director的私网DIP。
请求和响应报文都需要director转发，会成为整个系统的瓶颈。
支持端口映射，client访问80端口，director可以映射到RS的8080端口上。
director必须是Linux系统。
director需要两个网卡，一个与互联网通信的公网VIP，一个与RS通信的私网DIP。
点击链接查看NAT模式配置过程：NAT模式配置过程

TUN模式

IP隧道技术又称IP封装，在源和目标IP地址的基础上，利用新的源和目标IP地址对数据报文进行第二次封装。

1、client请求资源，源和目标IP为CIP-VIP的报文到达director，IPVS会利用隧道技术将DIP-RIP封装在请求报文中，经POSTROUTING链发送至RS，RS本地需要配置tunl0地址为VIP，当RS接收到报文，二次封装的目标地址RIP为本地eth0地址，原始目标地址VIP为本地tunl0地址，所以RS就会认定是发送给自己的数据包，就会处理请求。

2、RS响应请求，由于请求报文源和目标IP是CIP-VIP，所以响应报文的源和目标地址应为VIP-CIP；此时报文会经由RS的网关路由一直送达client。
特点：

VIP、DIP、RIP都是公网IP。
RS网关不会也不能指向DIP。
请求报文经过director，响应报文直接由RS发送给client，director不再成为系统瓶颈。
RS必须支持隧道技术。
不支持端口映射。

DR模式

1、client请求资源，请求报文经过路由到达交换机，然后交换机查看目标IP为VIP，则修改源和目标MAC后再封装报文发送给director，IPVS则将报文源MAC修改为DIP的MAC地址，目标MAC修改为RIP的MAC地址，然后经POSTROUTING链发送出去，通过交换机转送给RS。DR模式会lo接口上配置一个虚拟地址VIP，当RS收到报文拆封发现目标MAC地址是自己，目标IP地址也是自己的lo地址VIP，就会处理请求。

2、RS响应请求，由于请求报文的目标IP是VIP，所以响应报文就通过lo接口传送到eth0网卡发出。
特点：

保证前端路由将目标地址为VIP的报文全部发送给DS，而不是RS
RS的RIP可以使用私有地址，但也可以使用公网地址
RS和director必须在同一物理网络中
请求报文有director调度，但响应报文不一定经由director
不支持端口映射
RS的网关不能指向DIP

DR模式配置过程：https://www.cnblogs.com/houyongchong/p/10535993.html 或 https://blog.51cto.com/13599730/2312603 或 https://blog.csdn.net/qq_41772936/article/details/80146464

调度算法：

RR 轮询
Round Robin ：新的连接请求被轮流分配至各RealServer,优点是该算法无需记录当前所有连接的状态，效率高；但缺点是在RealServer当中如果有性能不均等的情况下，性能差的主机将负载比较大。该算法容易倒致服务器之间负载不均衡；
WRR 加权轮询
Weighted RR ：优点与RR一样，无需记录所有连接状态；通过设定一定的权重值来分配连接请求；
SH 源地址哈希
Source Hashing ：通过一个散列函数将去往同一个目的IP的请求映射到一台服务器或链路上。
DH 目标地址哈希
Destination Hashing : 通过一个散列函数将来自同一个源IP的请求映射到一台服务器或链路上
LC 最少连接数
Least Connection ：根据当前各服务器的连接数来估计服务器的负载情况，把新的连接分配给连接数最小的服务器；负载率=active*256+inactive，值小的优先分配请求；
WLC 加权最少连接数
Weighted LC ：与LC类似，根据当前各服务器的连接数来估计服务器的负载情况，把新的连接分配给连接数最小的服务器；负载率=(active*256+inactive)/weight，值小的优先分配请求；
SED 最短期望延迟
Shortest Expect Delay : 这个算法主要是优化LC的，在服务均在请求少的时候避免负载到一台服务器上做的优化；负载率=(active+1)*256/weight，值小的优先分配请求；
NQ 永不排队
Nerver Queue ：在负载低时，请求直接分配到空闲服务器上，不会产生请求等待；当服务器都很忙时，将轮询；
LBLC 基于本地最少连接
Locality-Based Least Connection：根据请求的目标IP地址找出该目标IP地址最近使用的RealServer，若该Real Server是可用的且没有超载，将请求发送到该服务器；若服务器不存在，或者该服务器超载且有服务器处于一半的工作负载，则用“最少链接”的原则选出一个可用的服务器，将请求发送到该服务器。
LBLCR 带复制的基于本地最少连接
Replicated and Locality-BasedLeast Connection ：该算法根据请求的目标IP地址找出该目标IP地址对应的服务器组，按“最小连接”原则从服务器组中选出一台服务器，若服务器没有超载，将请求发送到该服务器；若服务器超载，则按“最小连接”原则从这个集群中选出一台服务器，将该服务器加入到服务器组中，将请求发送到该服务器。

注：本文来自互联网

LVS简介及三种模式讲解

前言