一、企业群集应用概述
群集的含义
- Cluster,集群,群集
- 由多台主机构成,但对外只表现为一个整体,只提供一个访问入口(域名或IP),相当于一台大型计算机
在互联网应用中,随着站点对硬件性能、响应速度、服务稳定性、数据可靠性等要求越来越高,单台服务器力不从心
解决方法:
- 使用价格昂贵的小型机、大型机
- 使用普通服务器构建服务群集
二、企业群集分类
根据群集所针对的目标差异,可分为三种类型
- 负载均衡群集
- 高可用群集
- 高性能运算群集
1、负载均衡群集(Load Balance Cluster)
- 以提高应用系统的响应能力、尽可能处理更多的访问请求、减少延迟为目标,获得高并发、高负载(LB)的整体性能
例如:“DNS轮询” 、 “应用层交换” 、 “反向代理” 等都可用作负载均衡群集
- LB的负载分配依赖于主节点的分流算法(调度算法)
2、高可用群集(High Availability Cluster)
建立两个调度器构成高可用群集(可靠)
- 以提高应用系统的可靠性、尽可能的减少中断时间为目标,确保服务的连续性,达到高可用(HA)的容错效果
例如:“故障切换” 、 “双机热备” 、 “多机热备” 等都属于高可用群集技术。
- HA的工作方式包括双工和主从两种模式
双工:即所有节点同时在线;
属于平级状态,视为一个整体,其中一个宕机,其他节点可以顶替(去中心化机制,没有master)
主从:只有主节点在线,但当出现故障时从节点能自动切换为主节点;
身份上的区别,一个主,多个从。带有主从关系的叫做中心化机制,群集(中心为mastr,级别高)
3、高性能运算群集(High Performance Computer Cluster)
- 以提高应用系统的CPU运算速度、扩展硬件资源和分析能力为目标,获得相当于大型、超级计算机的高性能运行(HPC)能力,又称算力。
- 高性能运算群集的高性能依赖于“分布式运算”、“并行运算”,通过专用硬件和软件将多个服务器的CPU、内存等资源整合在一起,实现只有发行、超级计算机才具备的计算能力
不同类型的群集在必要时可以合并,如高可用的负载均衡群集
三、负载均衡群集工作模式分析
负载均衡群集是目前企业用得最多的群集类型
关于群集的负载调度技术,可以基于IP、端口、内容等进行分发,其中基于IP的负载调度时效率最高的。
基于IP的负载均衡模式中,常见的群集负载调度技术有三种工作模式:
-
地址转换
-
IP隧道
-
直接路由
1、NAT模式
地址转换(Network Address Translation)
- 简称NAT模式,类似于防火墙的私有网络结构,负载调度器作为所有服务器节点的网关,即作为客户机的访问入口,也是各节点回应客户机的访问出口
- 服务器节点使用私有IP地址,与负载调度器位于同一个物理网络,安全性要优于其他两种方式
2、TUN模式(IP隧道)
IP隧道(IP Tunnel)所有IP都是在公网
- 简称TUN模式,采用全开放式的网络结构,负载调度器仅作为客户机的访问入口,各节点通过各自的Internet连接直接回应客户机,而不在经过负载调度器
- 服务器节点分散在互联网中的不同位置,具有独立的公网IP地址,通过专用IP隧道与负载调度器相互通信
3、DR模式(直接路由)
直接路由(Direct Routing)
- 简称DR模式,采用半开放式的网络结构,与TUN模式的结构类似,但各节点并不是分散在各地,而是与调度器位于同一个物理网络
- 负载调度器与各节点服务器通过本地网络连接,不需要建立专用的IP隧道
DR与TUN不同点 :
DR: 半开放式网络结构,私有网络,节点与调度器在同一个物理网络,不需要建立IP隧道
IP隧道(安全,加速):全开放式网络结构,公网,节点分散在不同位置,建立IP隧道与负载调度器通信
DR与TUN共同点:
访问都是经过调度器,回去都是直接回,不经过调度器
NAT:安全,出入都需要经过负载均衡器,内外网口
NAT模式只需要一个公网IP地址,从而称为最易用的一种负载均衡模式,安全性也比较好,许多硬件负载均衡设备就是采用这种方式;相比较而言,DR模式和TUN模式的负载能力更加强大、使用范围更广,但节点的安全性要差一些
四、负载均衡群集架构
负载均衡的结构
在典型的负载均衡群集中,包括三个层次的组件。前端至少有一个负载均衡调度器负责相应并分发来自客户机的访问请求;后端由大量真实服务器构成服务器池,提供实际的应用服务,整个群集的伸缩性通过增加、删除服务器节点来完成,而这些过程对客户机是透明的;为了保持服务的一致性,所有节点使用共享存储设备
-
第一层:负载调度器(Load Balancer或Director)
这是访问整个群集系统的唯一入口,对外使用所有服务器共有的VIP(Virtual IP,虚拟IP)地址,也成为群集IP地址。通常会配置主、备两台调度器实现热备,当主调度器失效以后平滑替换至备用调度器,确保高可用性 -
第二层:服务器池(Server Pool)
群集所提供的应用服务(如HTTP、FTP)由服务器池承担,其中的每个节点具有独立的RIP(Real IP,真实IP)地址,只处理调度器分发过来的客户机请求。当某个节点暂时失效时,负载调度器的容错机制会将其隔离,等待错误排除以后在重新纳入服务器池。 -
第三层:共享存储(Share Storage)
为服务器池中的所有节点提供稳定、一致的文件存储服务,确保整个群集的统一性。在Linux/UNIX环境中,共享存储可以使用NAS设备,或者提供NFS(Network File System,网络文件系统)共享服务的专用服务器
五、关于LVS虚拟服务器
1、Linux Virtual Server
- 针对Linux内核开发的一个负载均衡项目。1998年5月,由我国的章文嵩博士创建
- LVS现在已成为linux内核的一部分,默认编译为ip_vs模块,必要时能够自动调用
- 官方网站:http://www.linuxvirtualserver.org/
确认内核对LVS的支持,加载模块并查看当前系统中ip_vs模块的版本信息
[root@localhost ~]# modprobe ip_vs
[root@localhost ~]# cat /proc/net/ip_vs
2、LVS的负载调度算法
针对不同的网络服务和配置需要,LVS调度器提供多种不同的负载调度算法,其中最常见的四种算法包括轮询、加权轮询、最少连接、加权最少连接
1)轮询(Round Robin)
- 将收到的访问请求按照顺序轮流分配给群集中的各节点(真实服务器),均等地对待每一台服务器,而不管服务器实际的连接数和系统负载
2)加权轮询(Weighted Round Robin)
- 根据真实服务器的处理能力轮流分配收到的访问请求,调度器可以自动查询各节点的负载情况,并动态调整其权重
- 保证处理能力强的服务器承担更多的访问流量
3)最少连接(Least Connections)
- 根据真实服务器已建立的连接数进行分配,将受到的访问请求优先分配给连接数最少的节点
4)加权最少连接(Weighted Least Connections)
- 在服务器节点的性能差异较大的情况下,可以为真实服务器自动调整权重
- 权重较高的节点将承担更大比例的活动连接负载
权重是分配访问的个数,处理请求的能力越强,权重分高点
3、使用ipvsadm工具
ipvsadm是在负载调度器上使用的LVS群集管理工具,通过调度ip_vs模块来添加、删除服务器节点以及查看群集的运行状态
4、NFS共享存储服务
Network File System,网络文件系统
- 依赖于RPC(远程过程调用)
- 需安装nfs-utils、rpcbind软件包
- 系统服务:nfs、rpcbind
- 共享配置文件:/etc/exports