自动化部署(二)

2 自动化部署流程设计

2.1 需求分解

一个集群有10个节点:

  1. 一键部署10个节点。
  2. 一键回滚到任意版本。
  3. 一键回滚到上个版本。

2.2 部署流程分解

  1. 代码放在哪里? git/svn
  2. 获取什么版本的代码?
    svn: 指定版本号
    git: 指定tag
  3. 差异解决:
    • 各个节点的配置文件差异:列如crontab.xml 只需要由一台机器来执行或者是预生产节点和生产节点的配置文件有差异。
    • 代码仓库和实际的差异,配置文件是放在代码仓库中。
  4. 如何更新?tomcat 部署过后需要重启。
  5. 测试。
  6. 串行部署还是并行部署。
  7. 如何执行?shell还是web界面。

上线流程

1.获取代码(直接拉取) 》2.编译(可选,java代码需要编译)》3.替换配置文件》4.打包 》5. scp到指定的服务器 》6.将目标服务器移除集群 》7.解压 》8.放置到webroot 》9.scp差异文件 》10.重启应用(可选,tomcat需要重启) 》11.测试 》12.加入集群

回滚流程 - 普通流程

1.列出回滚的脚本 》2.将目标服务器从集群中移除 》3.执行回滚版本 》4.重启和测试 》5.加入集群

回滚流程 - 紧急流程
1.列出回滚版本 》2.执行回滚 》 3.重启

回滚流程 - 最

1.回滚上个版本 》2.重启

2.3 部署脚本

2.3.1 部署准备

  1. 所有的web服务都应该使用普通用户运行。(用root用户运行web服务,系统如果被黑,那就没法玩了。)
  2. 所有的web服务都不应该监听80端口,负载均衡器除外。

2.3.1 部署脚本内容

#!/bin/bash

#NODE LIST
NODE_LIST="10.0.0.205 10.0.0.203"

# 生产中有预热节点,一般预热节点为一台。
PRE_LIST="10.0.0.203"
GROUP2_LIST="10.0.0.205"
ROLLBACK_LIST="10.0.0.205 10.0.0.203"

# Date/Time variables
LOG_DATE='date +"%Y-%m-%d"'
LOG_TIME='date +"%H-%M-%S"'

CDATE=$(date +"%Y-%m-%d")
CTIME=$(date +"%H-%M-%S")

# shell env
SHELL_NAME="deploy.sh"
SHELL_DIR="/home/www"
SHELL_LOG="${SHELL_DIR}/${SHELL_NAME}.log"

# CODE ENV
PRO_NAME="web_demo"
CODE_DIR="/deploy/code/${PRO_NAME}"
CONFIG_DIR="/deploy/config/${PRO_NAME}"
TMP_DIR="/deploy/tmp"
TAR_DIR="deploy/tar"
LOCK_FILE="/tmp/deploy.lock"

# FUNCTION

url_test(){
    URL=$1
    curl -s -I "$URL"|grep '200 OK'
    if [ $? -ne 0 ];then
        shell_unlock;
        writelog "test error" && exit
    fi
}

usage(){
    echo "usage: $0 { deploy | rollback [list | version]}"
}

writelog(){
    LOGINFO=$1
    echo "${CDATE} ${CTIME}: ${SHELL_NAME} :${LOGINFO}" >> ${SHELL_LOG}

}

shell_lock(){
    touch ${LOCK_FILE} 

}

shell_unlock(){
    rm -f $LOCK_FILE
}

code_get(){
    writelog 'code_get';
    # $CODE_DIR目录下只能进行git pull
    cd $CODE_DIR && git pull
    # git pull 之后就copy走
    cp -r ${CODE_DIR} ${TMP_DIR}/
    # 定义版本号,下面的PKG_NAME需要用到。
    API_VER=`git show|grep commit|cut -d " " -f 2|head -c 6`
}

code_build(){
echo code_build

}

code_config(){
    writelog  code_config
    # 加 -r 参数 ,覆盖原来的老文件。
    # 这里为什么是/bin/cp ??  后面为什么加“”
    /bin/cp -r ${CONFIG_DIR}/base/* ${TMP_DIR}/"${PRO_NAME}"
    PKG_NAME="${PRO_NAME}"_"$API_VER"_"${CDATE}-${CTIME}"   
    cd ${TMP_DIR} && mv ${PRO_NAME} ${PKG_NAME}
}

code_tar(){
    writelog "code_tar"
    cd ${TMP_DIR} && tar -cf ${PKG_NAME}.tar.gz $PKG_NAME
}

code_scp(){
    writelog "code_scp"
    for  node in $NODE_LIST
    do
        # /opt/webroot 目录要存在
        scp -P52113 ${TMP_DIR}/${PKG_NAME}.tar.gz $node:/opt/webroot
    done
}

cluster_node_remove(){
    writelog "cluster_node_remove"
}

pre_deploy(){
# 先上预热节点,当他测试没问题的时候再接着上下面的节点。

    writelog 'remove from cluster'
    ssh -p52113 ${PRE_LIST} "cd  /opt/webroot && tar xf ${PKG_NAME}.tar.gz"   
    ssh -p52113 ${PRE_LIST} "rm -f /webroot/web-demo && ln -s /opt/webroot/${PKG_NAME} /webroot/web-demo"
}

pre_test(){
    url_test http://${PRE_LIST}/index.html
}

group2_deploy(){
# 包含
        writelog 'remove from cluster.'
        for node in $GROUP2_LIST
        do
                ssh -p52113 $node "cd  /opt/webroot && tar xf ${PKG_NAME}.tar.gz"
                ssh -p52113 $node "rm -f /webroot/web-demo && ln -s /opt/webroot/${PKG_NAME} /webroot/web-demo"
        done
        # 差异配置文件,应该放到最后去完成。如果软连接没完成,而配置文件拷贝过去就尴尬了。
        scp -P52113 ${CONFIG_DIR}/other/10.0.0.205.crontab.xml 10.0.0.205:/webroot/web-demo/crontab.xml
}

group2_test(){
    for node in $GROUP2_LIST
    do
        url_test http://${node}/index.html
    done
}

cluster_node_in(){
    echo cluster_node_in
}

rollback_fun(){
    ROLLBACK_VER=$1
    for node in $ROLLBACK_LIST
    do
        ssh -p52113 $node "[ -d /opt/webroot/"$ROLLBACK_VER" ] && rm -f /webroot/web-demo && ln -s /opt/webroot/${ROLLBACK_VER} /webroot/web-demo || echo rollback failed."
    done
}

rollback(){
    ROLLBACK_VER=$1
    [ -z "$ROLLBACK_VER" ] && echo "exit! no version." && shell_unlock && exit

    case $ROLLBACK_VER in
    list)
        #ssh -p52113 10.0.0.203 'ls -l /opt/webroot/*.tar.gz |awk -F "[/.]" "{print $(NF-2)}"'
        ssh -p52113 10.0.0.203 "find /opt/webroot/ -maxdepth 1 -type d|cut -d "/" -f 4"
        ;;
    *)
        rollback_fun $ROLLBACK_VER          
    esac
}

main(){
    # 进程锁
    [ -f "$LOCK_FILE" ] && echo "deploy is running " && exit
    DEPLOY_METHOD=$1
    ROLLBACK_VER=$2
    case $DEPLOY_METHOD in
      deploy)
        shell_lock;
        code_get;
        code_build;
        code_config;
        code_tar;
        code_scp;
        cluster_node_remove;
        pre_deploy;
        pre_test;
        group2_deploy;
        group2_test;
        cluster_node_in;
        shell_unlock;
        ;;
      rollback)
        shell_lock;
        rollback $ROLLBACK_VER;
        shell_unlock;
        ;;
      *)
        usage;
    esac

}

# $1: deploy | rollback
# $2: rollback version

main $1 $2

猜你喜欢

转载自blog.51cto.com/damaicha/2118712