シロナガスクジラの自動運用および保守プラットフォーム
1.シロナガスクジラの紹介
公式ウェブサイト:https://bk.tencent.com/docs/
BlueWhaleと呼ばれるTencentBlue Whale Smart Cloudは、Tencent Interactive Entertainment Group(IEG)が開発し、統合されたエンタープライズR&Dおよび運用システムを構築するために使用するPaaS開発フレームワークです。PaaS(DevOpsパイプライン、オペレーティング環境ホスティング、フロント-エンドおよびバックエンドフレームワーク)とiPaaS(継続的な統合、CMDB、オペレーティングプラットフォーム、コンテナ管理、データプラットフォーム、AIおよびその他のアトミックプラットフォーム)およびその他のモジュールは、エンタープライズ技術者が基本的な運用PaaSを迅速に構築するのに役立ちます。
2.シロナガスクジラの配備
2.1。環境への準備
オペレーティング・システム | CPU | 羊 | IP |
---|---|---|---|
centos7.5 | 8コア | 6.5G | 192.168.81.240 |
2.2.Selinuxを閉じる
[root@localhost ~]# setenforce 0
[root@localhost ~]# sed -ri '/^SELINUX=/c SELINUX=disabled' /etc/selinux/config
[root@localhost ~]# sed -ri '/^SELINUX=/c SELINUX=disabled' /etc/sysconfig/selinux
2.3。ファイアウォール/ネットワークコンフィギュレータをオフにします
[root@localhost ~]# systemctl stop firewalld.service
[root@localhost ~]# systemctl disable firewalld.service
Removed symlink /etc/systemd/system/multi-user.target.wants/firewalld.service.
Removed symlink /etc/systemd/system/dbus-org.fedoraproject.FirewallD1.service.
[root@localhost ~]# systemctl stop NetworkManager
[root@localhost ~]# systemctl disable NetworkManager
2.4。開いているファイルの最大数を調整します
[root@localhost ~]# echo 'root soft nofile 102400' >> /etc/security/limits.d/20-nproc.conf
[root@localhost ~]# echo 'root hard nofile 102400' >> /etc/security/limits.d/20-nproc.conf
[root@localhost ~]# reboot
2.5.yumウェアハウスを構成します
[root@localhost ~]# curl -o /etc/yum.repos.d/epel.repo http://mirrors.aliyun.com/repo/epel-7.repo ;curl -o /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo
[root@localhost ~]# ls /etc/yum.repos.d/
CentOS-Base.repo epel.repo
2.6。ソフトウェアパッケージの準備
程序包
https://bk.tencent.com/download/
ssl认证文件
https://bk.tencent.com/download_ssl/
2.7。非標準のIP処理方法
インストールディレクトリ内の次のファイル(非標準アドレス)からIPを取得するためのシロナガスクジラコミュニティバージョン展開スクリプトの関数get_lan_ipは、展開前に変更する必要があります
[root@localhost install]# grep -l 'get_lan_ip *()' -r /data/install/
変更方法:
サーバーのIPが129.xxxであると仮定します
2.8。paas、cmdb、jobをインストールします
1)准备安装目录
[root@localhost soft]# mkdir /data
2)解压
[root@localhost soft]# tar xf bkce_src-5.1.28.tar.gz /data
[root@localhost ~]# ls /data/
install src
3)解压ssl认证
[root@localhost ~]# tar xf /soft/ssl_certificates.tar.gz -C /data/src/cert/
4)环境检测
[root@localhost install]# ./precheck.sh
如果报错则使用-r重新检测
[root@localhost install]# ./precheck.sh -r
5)部署组件
如果部署所有组件
[root@localhost install]# ./install_minibk -y
按需部署则
[root@localhost install]# ./install_minibk
[root@localhost install]# ./install_minibk paas && ./install_minibk cmdb && ./install_minibk job
パスコンポーネントが正常にインストールされました
cmdbコンポーネントが正常にインストールされました
ジョブコンポーネントが正常にインストールされました
2.9.app_mgrをインストールします
[root@rbtnode1 install]# ./bk_install app_mgr
2.10.pkdataをインストールします
[root@rbtnode1 install]# ./bk_install bkdata
2.11.ftaをインストールします
[root@rbtnode1 install]# ./bk_install fta
2.12.gse_agentをインストールします
[root@rbtnode1 install]# ./bk_install gse_agent
2.13.saas-oをインストールします
[root@rbtnode1 install]# ./bkcec install saas-o
2.14。上記のすべてがインストールされた後、ノード管理をインストールします
[root@rbtnode1 install]# ./bk_install saas-o bk_nodeman
3.トラブルシューティング
3.1。app_mgrのインストール時のエラー
理由:paas_agentを開始できず、paasが解決されませんでした
解決:
解析paas
/data/bkce/bin/health_check/check_proc_exists -m paas
查看一下appt的状态
[root@rbtnode1 install]# ./bkcec status appt
[192.168.81.240] paas_agent() paas_agent FATAL Exited too quickly (process log may have details)
[192.168.81.240] nginx: RUNNING
发现没有启动,启动appt
[root@rbtnode1 install]# ./bkcec start appt
[192.168.81.240]20200616-104319 98 starting appt(ALL) on host: 192.168.81.240
paas_agent: started
3.2.bkdataのインストール時のエラー
解決
[root@rbtnode1 install]# /data/bkce/service/zk/bin/zkCli.sh -server zk.service.consul:2181 ls /common_kafka/brokers/ids
Connecting to zk.service.consul:2181
log4j:WARN No appenders could be found for logger (org.apache.zookeeper.ZooKeeper).
log4j:WARN Please initialize the log4j system properly.
log4j:WARN See http://logging.apache.org/log4j/1.2/faq.html#noconfig for more info.
WATCHER::
WatchedEvent state:SyncConnected type:None path:null
[1]
[root@rbtnode1 ~]# pip install kazoo
3.3。スキル
一般的に、上の写真の現象は、対応するプラグインがインストールされていないことであり、インストールによって問題を解決できます
4.注意が必要な事項
4.1。ホストの再起動
ホストが再起動した後、paas、cmdb、jobなどの一連のモジュールを手動で開始する必要があります。
最初に開始されているかどうかを確認します。開始されている場合は、。/ bkcec stop modulenameを使用して使用を停止します。/bkcecstartmodulenameを使用して開始します。
PAASを開始します
[root@rbtnode1 install]# ./bkcec start paas
[192.168.81.240]20200616-205049 98 starting paas(ALL) on host: 192.168.81.240
Unlinking stale socket /data/bkce/logs/open_paas/supervisor.sock
cmdbを開始します
[root@rbtnode1 install]# ./bkcec stop cmdb
[192.168.81.240]20200616-205617 135 stopping cmdb(ALL) on host: 192.168.81.240
cmdb_hostcontroller: stopped
cmdb_hostserver: stopped
cmdb_toposerver: stopped
cmdb_objectcontroller: stopped
cmdb_webserver: stopped
cmdb_procserver: stopped
cmdb_auditcontoller: stopped
cmdb_apiserver: stopped
cmdb_eventserver: stopped
cmdb_datacollection: stopped
cmdb_adminserver: stopped
cmdb_proccontroller: stopped
Shut down
[root@rbtnode1 install]# ./bkcec start cmdb
[192.168.81.240]20200616-205626 98 starting cmdb(ALL) on host: 192.168.81.240
ジョブを開始します
[root@rbtnode1 install]# ./bkcec start job
[192.168.81.240]20200616-205129 98 starting job(ALL) on host: 192.168.81.240
app_mgrを起動します
[root@rbtnode1 install]# ./bkcec status appo
[192.168.81.240] paas_agent() paas_agent RUNNING pid 19074, uptime 1:40:13
[192.168.81.240] nginx: RUNNING
[root@rbtnode1 install]# ./bkcec status appt
[192.168.81.240] paas_agent() paas_agent RUNNING pid 19074, uptime 1:41:51
[192.168.81.240] nginx: RUNNING
bkdataを開始します
[root@rbtnode1 install]# ./bkcec status bkdata