nginx和keepalived实现nginx高可用

https://blog.csdn.net/u012453843/article/details/69668663

　　首先介绍一下Keepalived，它是一个高性能的服务器高可用或热备解决方案，Keepalived主要来防止服务器单点故障的发生问题，可以通过其与Nginx的配合实现web服务端的高可用。

　　Keepalived以VRRP协议为实现基础，用VRRP协议来实现高可用性（HA）.VRRP (Virtual Router Redundancy Protocol)协议是用于实现路由器冗余的协议，VRRP协议将两台或多台路由器设备虚拟成一个设备，对外提供虚拟路由器IP（一个或多个），如下图所示：
　　这里写图片描述

　　这张图的意思是，我们使用keepalived来管理两台设备的Nginx，并虚拟出一个IP，我们现在两台装有Nginx的设备分别是192.168.156.11和192.168.156.12，那么我们可以虚拟出一个192.168.156.xx的IP，外界请求直接访问虚拟IP而不是真正的Nginx，让虚拟IP去访问提供服务的Nginx（注意：高可用是指同一时间提供服务的只有一台设备，提供服务的设备挂掉之后，备份服务器便开始提供服务），然后再由Nginx去访问tomcat。

　　我们拿两台虚拟机来搭建nginx高可用环境，这两台设备分别是192.168.156.11（主机名是nginx1）和192.168.156.12（主机名是nginx2）。

　　如果是最小化安装的两台虚拟机，在搭建环境前需要做如下准备操作：

　　1.给虚拟机配置静态IP并要能上网，大家可以参考：http://blog.csdn.net/u012453843/article/details/52839105这篇博客进行学习

　　2.安装vim命令，使用命令：yum install vim-enhanced

　　3.安装gcc，使用命令：yum install make cmake gcc gcc-c++

　　4.安装依赖，如下所示。

yum install pcre    
yum install pcre-devel    
yum install zlib    
yum install zlib-devel

　　做完了以上准备操作，我们可以安装nginx了，关于nginx的安装，大家可以参考：http://blog.csdn.net/u012453843/article/details/69396434这篇博客进行学习。
　　下面我们在192.168.156.11和192.168.156.12两台设备上都安装下keepalived。大家可以到http://download.csdn.net/detail/u012453843/9808913这个地址下载keepalived-1.2.18.tar.gz。

　　1、两台设备都进入到/usr/local/software目录下，方法是在XShell下面的输入框中输入命令cd /usr/local/software，回车，如下图所示。注意：下图输入框左边的图标要是多窗口图标，如果当前不是多窗口图标，可以点击输入框后面的那个图标，选择“全部XShell(X)”。
　　这里写图片描述

　　2、解压，我们在下面的输入框中输入tar -zxvf keepalived-1.2.18.tar.gz -C /usr/local/并按回车即可在两台设备同时进行解压操作。
　　这里写图片描述

　　3、安装一个软件包，在下面的输入框中输入：yum install -y openssl openssl-devel并按回车即可在两台设备同时安装软件包openssl。
　　这里写图片描述

　　解压完之后，我们可以到/usr/local目录下查看一下，发现已经有解压好的keepalived-1.2.18了。
　　这里写图片描述

　　4、对keepalived进行配置，我们在下面的输入框中输入cd keepalived-1.2.18/ && ./configure –prefix=/usr/local/keepalived并按回车即可在两台设备同时进行配置。
　　这里写图片描述

　　5、进行编译安装，我们在下面的输入框中输入make && make install并按回车，即可在两台设备同时进行编译安装。
　　这里写图片描述

　　安装完nginx之后，我们把keepalived做成一个服务，这样可以做到开机自动启动，步骤如下：

　　1、创建/etc/keepalived目录，我们在下面的输入框中输入mkdir /etc/keepalived并按回车，即可同时在两台设备上创建/etc/keepalived。
　　这里写图片描述

　　2、复制几个文件到指定目录

　　先复制第一个文件，我们在下面的输入框中输入cp /usr/local/keepalived/etc/keepalived/keepalived.conf /etc/keepalived/并按回车，即可在两台设备同时完成复制操作。
　　这里写图片描述

　　下面复制第二个文件，我们在下面的输入框中输入cp /usr/local/keepalived/etc/rc.d/init.d/keepalived /etc/init.d/并按回车，即可同时在两台设备上完成复制该文件操作。
　　这里写图片描述

　　下面复制第三个文件，我们在输入框中输入cp /usr/local/keepalived/etc/sysconfig/keepalived /etc/sysconfig/并按回车，即可在两台设备同时执行复制文件操作。
　　这里写图片描述

　　3、创建两个软链接

　　首先创建第一个软链接，我们在下面的输入框中输入ln -s /usr/local/sbin/keepalived /usr/sbin/并按回车即可完成在两台设备上同时创建软链接。
　　这里写图片描述

　　下面我们创建第二个软链接，我们在下面的输入框中输入ln -s /usr/local/keepalived/sbin/keepalived /sbin/并按回车即可同时在两台设备上创建该软链接。
　　这里写图片描述

　　4、设置成开机启动，我们在下面的输入框中输入chkconfig keepalived on并按回车即可完成对两台设备同时设置keepalived服务开机启动。
　　这里写图片描述

　　既然设置成了系统服务，那么我们便尝试使用service keepalived start来启动该服务。如下图所示，发现两台设备都可以正常启动keepalived服务，说明我们设置是成功的。
　　这里写图片描述

　　我们可以重启服务也可以关闭服务，如下所示。我们先关闭两个节点的keepalived服务。

[root@nginx2 usr]# service keepalived restart  
停止 keepalived：                                          [确定]  
正在启动 keepalived：                                      [确定]  
[root@nginx2 usr]# ps -ef | grep keepalived  
root       3131      1  0 00:38 ?        00:00:00 keepalived -D  
root       3133   3131  0 00:38 ?        00:00:00 keepalived -D  
root       3134   3131  0 00:38 ?        00:00:00 keepalived -D  
root       3136   1373  0 00:38 pts/0    00:00:00 grep keepalived  
[root@nginx2 usr]# service keepalived stop  
停止 keepalived：                                          [确定]  
[root@nginx2 usr]# ps -ef | grep keepalived  
root       3157   1373  0 00:38 pts/0    00:00:00 grep keepalived  
[root@nginx2 usr]#

　　下面我们便使用keepalived来实现nginx的高可用
　　1、我们需要修改下/etc/keepalived/keepalived.conf文件，首先修改192.168.156.11上的这个文件，修改后的配置内容如下

! Configuration File for keepalived  

global_defs {  
router_id nginx1  
}  

vrrp_script chk_nginx {  
script "/etc/keepalived/nginx_check.sh"  
interval 2  
weight -20  
}  

vrrp_instance VI_1 {  
state MASTER  
interface eth0  
virtual_router_id 11  
mcast_src_ip 192.168.156.11  
priority 100  
nopreempt  
advert_int 1  
authentication {  
auth_type PASS  
auth_pass 1111  
}  
track_script {  
chk_nginx  
}  
virtual_ipaddress {  
192.168.156.110  
}  
}

　　下面我们来具体学习下配置的意思，首先global_defs当中配置的是主机名，我的192.168.156.11的主机名是nginx1，因此这里配置的router_id的值是nginx1。

global_defs {  
router_id nginx1  
}

　　接着看下面这段配置，这段配置的意思是，每隔2秒中去执行/etc/keepalived/nginx_check.sh脚本一次，这项检查从开始便一直进行，interval表示间隔时间，weight -20的意思是，脚本执行成功后把192.168.156.11这个节点的优先级降低20。

vrrp_script chk_nginx {  
script "/etc/keepalived/nginx_check.sh"  
interval 2  
weight -20  
}

　　接着看下面这段配置，state MASTER表示该节点角色定义为MASTER，interface eth0是指虚拟机的网卡是eth0。virtual_router_id 11这项配置非常重要，两个节点的这项配置的值必须一样，否则会出现乱七八糟的问题，这里我把virtual_router_id的值设置为11是取自192.168.156.11的最后两位数字。mcast_src_ip 192.168.156.11这项配置是指定当前节点的真实IP。priority 100的意思是优先级，这里暂且设置为100，当然也可以是其它值。优先级在keepalived实现高可用方面起着至关重要的作用，keepalived服务器就是根据优先级来选择当前提供服务的设备的，192.168.156.11刚开始设置的优先级是100,192.168.156.12刚开始设置的优先级是90，这样keepalived一开始去检查优先级，发现192.168.156.11这台设备的优先级高，于是便让该设备对外提供服务，当192.168.156.11这台设备的nginx挂掉后，由于nginx_check.sh脚本每两秒执行一次，发现192.168.156.11这个节点没有nginx进程后便尝试进行重新启动nginx，如果重新启动还是不行的话，就杀掉所有的keepalived进程，并告诉keepalived服务器192.168.156.11这个节点的nginx挂掉了同时会把这个节点的优先级减20，从而优先级变为了80，这样下次keepalived来检查优先级发现192.168.156.12这个节点的优先级比较高（90），于是便让192.168.156.12这个节点对外提供服务，同理，这个节点发生故障的话，也会再去让另外一个节点来提供服务，这就实现了高可用。

vrrp_instance VI_1 {  
state MASTER  
interface eth0  
virtual_router_id 11  
mcast_src_ip 192.168.156.11  
priority 100  
nopreempt  
advert_int 1  
authentication {  
auth_type PASS  
auth_pass 1111  
}  
track_script {  
chk_nginx  
}  
virtual_ipaddress {  
192.168.156.110  
}  
}

　　那么怎么查看虚拟机的网卡是什么呢？我们使用命令ip a来查看，如下图所示，可以看到192.168.156.11这台虚拟机的网卡是eth0。而且现在可以看到这台设备只有一个IP地址，等一会儿配置好之后，会有虚拟IP的信息。
　　这里写图片描述

　　下面我们来看如下配置，这段配置两个节点要一样，表明它们属于一个组，keepalived会同一组中去做检查并保持高可用。

authentication {  
auth_type PASS  
auth_pass 1111  
}

　　下面再看这段配置，这段配置中的”chk_nginx”与我们在上面定义的定时执行脚本配置（vrrp_script chk_nginx）的名称要一样。

track_script {  
chk_nginx  
}

　　下面再来看下面这段配置，这段配置的意思是对外提供的虚拟IP，这里可以是一个也可以是多个。

virtual_ipaddress {  
192.168.156.110  
}

　　看完了配置文件，我们再来看下定时检查nginx的脚本文件nginx_check.sh（需要确保脚本格式是unix格式，方法是vim进入编辑模式，然后输入:set ff并按回车即可看到格式）。，如下所示（注意：wc -l的”l”是小写的L而不是1）。

#!/bin/sh  
A=`ps -C nginx --no-header |wc -l`  
if [ $A -eq 0 ];then  
/usr/local/nginx/sbin/nginx  
sleep 2  
if [ `ps -C nginx --no-header |wc -l` -eq 0 ];then  
killall keepalived  
fi  
fi

　　我们来学习下这个脚本的意思，下面这行的意思是，使用ps -C nginx –no-header |wc -l命令去检查当前nginx的进程数量并把查询到的进程数量赋值给变量A。

A=`ps -C nginx --no-header |wc -l`

　　下面这行脚本的意思是，如果查询到的nginx的进程数量是0的话，就执行if条件里的内容。

if [ $A -eq 0 ];then

　　下面这行代码的意思是由于检查到当前没有nginx进程，因此尝试去启动nginx。

/usr/local/nginx/sbin/nginx

　　下面这行脚本的意思是启动nginx之后休眠2秒。

sleep 2

　　下面这段脚本的医生说是如果nginx的进程数还是0的话，就认为nginx已经挂掉了，需要杀掉这个节点上所有的keepalived进程。

if [ `ps -C nginx --no-header |wc -l` -eq 0 ];then  
killall keepalived  
fi

　　两个文件所在的目录是/etc/keepalived，如下所示。

[root@nginx1 keepalived]# pwd  
/etc/keepalived  
[root@nginx1 keepalived]# ll  
总用量 8  
-rw-r--r--. 1 root root 554 4月   9 01:51 keepalived.conf  
-rw-r--r--. 1 root root 180 4月   9 03:30 nginx_check.sh  
[root@nginx1 keepalived]#

　　以上便是192.168.156.11节点上的配置文件和脚本的内容。我们在192.168.156.12这个节点上也需要有这两个文件，192.168.156.12这个节点上keepalived.conf文件的内容如下：注意virtual_router_id的值要与192.168.156.11这个节点配置的值要一致。

! Configuration File for keepalived  

global_defs {  
router_id nginx2  
}  

vrrp_script chk_nginx {  
script "/etc/keepalived/nginx_check.sh"  
interval 2  
weight -20  
}  

vrrp_instance VI_1 {  
state BACKUP  
interface eth0  
virtual_router_id 11  
mcast_src_ip 192.168.156.12  
priority 90  
advert_int 1  
authentication {  
auth_type PASS  
auth_pass 1111  
}  
track_script {  
chk_nginx  
}  
virtual_ipaddress {  
192.168.156.110  
}  
}

　　nginx_check.sh脚本文件在两个节点上内容一样，192.168.156.12节点上两个文件目录与192.168.156.11一样，如下所示。

[root@nginx2 keepalived]# pwd  
/etc/keepalived  
[root@nginx2 keepalived]# ll  
总用量 8  
-rw-r--r--. 1 root root 553 4月   9 02:35 keepalived.conf  
-rw-r--r--. 1 root root 180 4月   9 02:41 nginx_check.sh  
[root@nginx2 keepalived]#

　　由于目前nginx_check.sh脚本只有读权限，因此我们需要把两个节点上这个文件的权限放开，如下图所示。
　　这里写图片描述

　　上面做好了铺垫之后，我们现在启动nginx，不过在启动nginx之前要保持两个节点nginx.conf配置一致，我们就都采用最原始的配置吧。如下所示。

#user  nobody;  
worker_processes  1;  

#error_log  logs/error.log;  
#error_log  logs/error.log  notice;  
#error_log  logs/error.log  info;  

#pid        logs/nginx.pid;  


events {  
worker_connections  1024;  
}  


http {  
include       mime.types;  
default_type  application/octet-stream;  

#log_format  main  '$remote_addr - $remote_user [$time_local] "$request" '  
#                  '$status $body_bytes_sent "$http_referer" '  
#                  '"$http_user_agent" "$http_x_forwarded_for"';  

#access_log  logs/access.log  main;  

sendfile        on;  
#tcp_nopush     on;  

#keepalive_timeout  0;  
keepalive_timeout  65;  

#gzip  on;  

server {  
listen       80;  
server_name  localhost;  

#charset koi8-r;  

#access_log  logs/host.access.log  main;  

location / {  
root   html;  
index  index.html index.htm;  
}  

#error_page  404              /404.html;  

# redirect server error pages to the static page /50x.html  
#  
error_page   500 502 503 504  /50x.html;  
location = /50x.html {  
root   html;  
}  

# proxy the PHP scripts to Apache listening on 127.0.0.1:80  
#  
#location ~ \.php$ {  
#    proxy_pass   http://127.0.0.1;  
#}  

# pass the PHP scripts to FastCGI server listening on 127.0.0.1:9000  
#  
#location ~ \.php$ {  
#    root           html;  
#    fastcgi_pass   127.0.0.1:9000;  
#    fastcgi_index  index.php;  
#    fastcgi_param  SCRIPT_FILENAME  /scripts$fastcgi_script_name;  
#    include        fastcgi_params;  
#}  

# deny access to .htaccess files, if Apache's document root  
# concurs with nginx's one  
#  
#location ~ /\.ht {  
#    deny  all;  
#}  
}  


# another virtual host using mix of IP-, name-, and port-based configuration  
#  
#server {  
#    listen       8000;  
#    listen       somename:8080;  
#    server_name  somename  alias  another.alias;  

#    location / {  
#        root   html;  
#        index  index.html index.htm;  
#    }  
#}  


# HTTPS server  
#  
#server {  
#    listen       443 ssl;  
#    server_name  localhost;  

#    ssl_certificate      cert.pem;  
#    ssl_certificate_key  cert.key;  

#    ssl_session_cache    shared:SSL:1m;  
#    ssl_session_timeout  5m;  

#    ssl_ciphers  HIGH:!aNULL:!MD5;  
#    ssl_prefer_server_ciphers  on;  

#    location / {  
#        root   html;  
#        index  index.html index.htm;  
#    }  
#}  

}

　　为了能够区分欢迎页是哪个节点的欢迎页，我们修改下欢迎页的信息，如下图所示。
　　这里写图片描述

　　下面我们来重新启动启动两个节点的nginx，如下所示。

[root@nginx1 html]# /usr/local/nginx/sbin/nginx -s reload  
[root@nginx1 html]#

[root@nginx2 html]# /usr/local/nginx/sbin/nginx -s reload  
[root@nginx2 html]#

　　启动nginx之后，我们首先直接访问192.168.156.11的nginx首页，如下图所示。
　　这里写图片描述

　　下面我们再直接访问192.168.156.12的nginx首页，如下图所示
　　这里写图片描述

　　下面我们启动两个节点上的keepalived，如下图所示。
　　这里写图片描述

　　启动keepalived之后，我们可以在两个节点上看到共同的虚拟IP192.168.156.110，如下图所示，我们发现在两个节点上都看到了虚拟IP192.168.156.110，这是不合理的，正确情况应该是只在Master角色的节点上有虚拟IP。
　　这里写图片描述

　　造成上图这种情况的原因是防火墙，为了避免因防火墙引起的各种问题，我们把两个节点的防火墙都关闭，而且可以设置开机也不启动防火墙，关闭防火墙的命令是：service iptables stop，设置不让防火墙开机重启的命令是chkconfig iptables off。关闭防火墙之后，我们再在两个节点查看IP信息，如下图所示，可以看到主节点192.168.156.11上有虚拟IP的信息，而备节点192.168.156.12上没有虚拟IP。这样才是正确的。
　　这里写图片描述

　　这时我们便可以通过使用虚拟IP：192.168.156.110来访问nginx了，如下图所示，可以看到我们这时访问到的是192.168.156.11这台设备上的nginx。之所以会看到这台设备上的nginx是因为我们给这台设备keepalived赋予的优先级是100，而另一台设备192.168.156.12上keepalived赋予的优先级是90，显然192.168.156.11的优先级要高于192.168.156.12，因此keepalived服务器会选择192.168.156.11这个节点上的nginx对外提供服务。
　　这里写图片描述

　　既然要达到高可用的目的，我们便来测试一下假如我们把192.168.156.11上的keepalived服务关掉之后，看keepalived服务器会不会自动帮我们切换到另一个节点192.168.156.12让其对外提供服务。

[root@nginx1 keepalived]# service keepalived stop  
停止 keepalived：                                          [确定]  
[root@nginx1 keepalived]#

　　关闭192.168.156.11的keepalived服务之后，我们再刷新http://192.168.156.110/，等一小会儿便可以看到提供nginx服务的自动变为nginx12了（也就是192.168.156.12），如下图所示。
　　这里写图片描述

　　等我们的192.168.156.11设备故障修复之后，我们重启keepalived，如下图所示。

[root@nginx1 keepalived]# service keepalived start  
正在启动 keepalived：                                      [确定]  
[root@nginx1 keepalived]#

　　这时我们再刷新http://192.168.156.110/就会看到如下图所示界面，可以看到这时提供nginx服务的又自动切换为192.168.156.11这个节点了。说明我们已经实现了高可用性。
　　这里写图片描述

　　由于我们把keepalived配置成了服务，并且设置成了开机自启动，下面我们把两台设备都重启，重启的命令是reboot。

　　重启后，我们使用命令service keepalived status查看keepalived是否自己启动了，而且我们在nginx_check.sh脚本中会自动开启nginx，如下所示，发现都自动开启了。

[root@nginx1 ~]# service keepalived status  
keepalived (pid  1197) 正在运行...  
[root@nginx1 ~]# ps -ef|grep nginx  
root       1233      1  0 22:10 ?        00:00:00 nginx: master process /usr/local/nginx/sbin/nginx  
nobody     1235   1233  0 22:10 ?        00:00:00 nginx: worker process        
root       1628   1524  0 22:12 pts/0    00:00:00 grep nginx  
[root@nginx1 ~]#

[root@nginx2 ~]# service keepalived status  
keepalived (pid  1198) 正在运行...  
[root@nginx2 ~]# ps -ef|grep nginx  
root       1234      1  0 22:10 ?        00:00:00 nginx: master process /usr/local/nginx/sbin/nginx  
nobody     1236   1234  0 22:10 ?        00:00:00 nginx: worker process        
root       1670   1531  0 22:12 pts/0    00:00:00 grep nginx  
[root@nginx2 ~]#

　　下面我还可以人为让nginx的配置文件出错，这样nginx_check.sh脚本文件在去尝试启动nginx时发现启动不成功，便会将keepalived也都杀掉。比如我们把192.168.156.11这台设备的nginx的配置文件人为修改出错，我们只需少写一个”;”即可，如下图所示，我们把”worker_connections 1024”后面的那个”;”去掉。
　　这里写图片描述

　　下面我们重启192.168.156.11这台虚拟机，重启之后，我们查看keepalived的状态，发现keepalived已经被杀掉了，nginx也没启动。出现这种情况的原因是，当192.168.156.11启动后，keepalived会自动启动，启动会每隔2秒去执行nginx_check.sh脚本文件，该脚本文件通过检查nginx的进程数量是0，于是去尝试启动nginx，由于我们把nginx.conf文件人为修改错了，因此无法正常启动脚本，在尝试了无法启动nginx之后，脚本便把keepalived的所有进程都杀掉了，于是便会看到我们下面的结果。

[root@nginx1 ~]# service keepalived status  
keepalived 已死，但是 subsys 被锁  
[root@nginx1 ~]# ps -ef|grep nginx  
root       1430   1398  0 22:27 pts/0    00:00:00 grep nginx  
[root@nginx1 ~]#

　　我们这时访问虚拟IP的话，便只能看到192.168.156.12对外提供nginx服务了，如下图所示。
　　这里写图片描述

　　至此，我们使用keepalived搭建nginx高可用便搭建完了。需要说明的是，keepalived不仅可以用于nginx的高可用，还可以用于redis、mysql等等所有服务的高可用。

nginx和keepalived实现nginx高可用

猜你喜欢