【Kafka】从安装到配置再到监控,教你搭建一套sasl/scram类型的Kafka集群


本文的主要内容是讲解一个4个broker,SASL/SCRAM类型的Kafka集群搭建过程。

准备工作

安装jdk

安装Zookeeper和kafka之前,需要先安装java环境,并配置环境变量,推荐Java 8。

安装zookeeper

Kafka依赖zookeeper,安装Kafka之前需要安装zk。
搭建过程参考:zookeeper搭建

安装包准备

下载安装包:

下载Kafka:http://kafka.apache.org/downloads

也可下载Confluent:https://www.confluent.io/download/#confluent-platform

confluent包含了Kafka以及其他组件,如果只需要用到Kafka的基本功能,下载Kafka即可,由于工作需要,我下载的是confluent,但是对Kafka使用的操作,都是一样的。

[root@JZJG-T-ZJJPTJZYZ-CDC-KAFKA-TEST-002 etc]# ll
total 4
drwxr-xr-x 2 1000 pgadmin   47 Jul 19  2018 camus
drwxr-xr-x 2 1000 pgadmin    6 Jul 19  2018 confluent-common
drwxr-xr-x 2 1000 pgadmin 4096 Feb  2 18:27 kafka
drwxr-xr-x 2 1000 pgadmin   49 Jul 19  2018 kafka-connect-elasticsearch
drwxr-xr-x 2 1000 pgadmin   40 Jul 19  2018 kafka-connect-hdfs
drwxr-xr-x 2 1000 pgadmin   90 Jul 19  2018 kafka-connect-jdbc
drwxr-xr-x 2 1000 pgadmin   88 Jul 19  2018 kafka-connect-s3
drwxr-xr-x 2 1000 pgadmin    6 Jul 19  2018 kafka-connect-storage-common
drwxr-xr-x 2 1000 pgadmin   59 Jul 19  2018 kafka-rest
drwxr-xr-x 2 1000 pgadmin  178 Jul 19  2018 ksql
drwxr-xr-x 2 1000 pgadmin    6 Jul 19  2018 rest-utils
drwxr-xr-x 2 1000 pgadmin  149 Jul 19  2018 schema-registry
[root@JZJG-T-ZJJPTJZYZ-CDC-KAFKA-TEST-002 etc]# pwd
/neworiental/cdc/confluent-4.1.2/etc
[root@JZJG-T-ZJJPTJZYZ-CDC-KAFKA-TEST-002 etc]# 
[root@JZJG-T-ZJJPTJZYZ-CDC-KAFKA-TEST-002 etc]# 

解压安装包:

[root@JZJG-T-ZJJPTJZYZ-CDC-KAFKA-TEST-002 cdc]# tar -zxvf confluent-4.1.2.tar.gz 
[root@JZJG-T-ZJJPTJZYZ-CDC-KAFKA-TEST-002 cdc]# cd confluent-4.1.2
[root@JZJG-T-ZJJPTJZYZ-CDC-KAFKA-TEST-002 confluent-4.1.2]# ls
bin  etc  lib  logs  README  share  src
[root@JZJG-T-ZJJPTJZYZ-CDC-KAFKA-TEST-002 confluent-4.1.2]# 

修改配置文件

confluent对应的kafka配置文件目录:$confluent_home$/etc/kafka/server.properties

独立的kafka包对应的配置文件在:$kafka_home$/config/server.properties

[root@JZJG-T-ZJJPTJZYZ-CDC-KAFKA-TEST-002 kafka]# ll
total 84
-rw-r--r-- 1 1000 pgadmin  906 Jul 19  2018 connect-console-sink.properties
-rw-r--r-- 1 1000 pgadmin  909 Jul 19  2018 connect-console-source.properties
-rw-r--r-- 1 1000 pgadmin 5994 Jul 19  2018 connect-distributed.properties
-rw-r--r-- 1 1000 pgadmin 5807 Jul 19  2018 connect-distributed.properties.orig
-rw-r--r-- 1 1000 pgadmin  883 Jul 19  2018 connect-file-sink.properties
-rw-r--r-- 1 1000 pgadmin  881 Jul 19  2018 connect-file-source.properties
-rw-r--r-- 1 1000 pgadmin 1111 Jul 19  2018 connect-log4j.properties
-rw-r--r-- 1 1000 pgadmin 2917 Jul 19  2018 connect-standalone.properties
-rw-r--r-- 1 1000 pgadmin 2730 Jul 19  2018 connect-standalone.properties.orig
-rw-r--r-- 1 1000 pgadmin 1221 Jul 19  2018 consumer.properties
-rw-r--r-- 1 root root     140 Feb  2 18:07 kafka_server_jaas.conf
-rw-r--r-- 1 1000 pgadmin 4727 Jul 19  2018 log4j.properties
-rw-r--r-- 1 1000 pgadmin 1919 Jul 19  2018 producer.properties
-rw-r--r-- 1 root root    8377 Feb  2 17:51 server.properties
-rw-r--r-- 1 1000 pgadmin 1032 Jul 19  2018 tools-log4j.properties
-rw-r--r-- 1 1000 pgadmin 1023 Jul 19  2018 zookeeper.properties
[root@JZJG-T-ZJJPTJZYZ-CDC-KAFKA-TEST-002 kafka]# pwd
/neworiental/cdc/confluent-4.1.2/etc/kafka
[root@JZJG-T-ZJJPTJZYZ-CDC-KAFKA-TEST-002 kafka]# 
[root@JZJG-T-ZJJPTJZYZ-CDC-KAFKA-TEST-002 kafka]# 

四个broker,除了broker.id和listeners 不一样,其他都一样。

核心配置如下:

#每一个broker在集群中的唯一表示,要求是正整数
broker.id=0
#Kafka服务端两种协议的监听地址,只需把IP替换为本台机器的即可
listeners=PLAINTEXT://172.24.29.128:9092,SASL_PLAINTEXT://172.24.29.128:9093 
#数据存储目录
log.dirs=/neworiental/cdc/data/kafka
#zk地址
zookeeper.connect=172.24.29.128:2181,172.24.29.129:2181,172.24.29.130:2181
#zk连接超时时间
zookeeper.connection.timeout.ms=6000

#scram相关
sasl.enabled.mechanisms=SCRAM-SHA-256
sasl.mechanism.inter.broker.protocol=SCRAM-SHA-256
security.inter.broker.protocol=SASL_PLAINTEXT
authorizer.class.name=kafka.security.auth.SimpleAclAuthorizer
allow.everyone.if.no.acl.found=true
super.users=User:admin

以上是核心配置,当然还有很多配置是重要的,对于Kafka优化也有很大的作用,感兴趣的可以查一查Kafka优化,后面也会有专门的文章讲解。

注意:如果是搭建一个PLAINTEXT类型的Kafka集群,每个broker修改完配置文件,依次启动即可,如果是搭建一个SASL/SCRAM类型的Kafka,还需要以下操作

创建初始用户

找到解压后对应的脚本目录,我的是在:/neworiental/cdc/confluent-4.1.2/bin

[root@JZJG-T-ZJJPTJZYZ-CDC-KAFKA-TEST-002 bin]# ls
camus-config                 kafka-console-consumer            kafka-producer-perf-test    kafka-server-start               ksql-print-metrics            windows
camus-run                    kafka-console-producer            kafka-reassign-partitions   kafka-server-stop                ksql-run-class                zookeeper-security-migration
confluent                    kafka-consumer-groups             kafka-replay-log-producer   kafka-simple-consumer-shell      ksql-server-start             zookeeper-server-start
connect-distributed          kafka-consumer-offset-checker     kafka-replica-verification  kafka-streams-application-reset  ksql-server-stop              zookeeper-server-stop
connect-standalone           kafka-consumer-perf-test          kafka-rest-run-class        kafka-topics                     ksql-stop                     zookeeper-shell
kafka-acls                   kafka-delegation-tokens           kafka-rest-start            kafka-verifiable-consumer        schema-registry-run-class
kafka-avro-console-consumer  kafka-delete-records              kafka-rest-stop             kafka-verifiable-producer        schema-registry-start
kafka-avro-console-producer  kafka-log-dirs                    kafka-rest-stop-service     ksql                             schema-registry-stop
kafka-broker-api-versions    kafka-mirror-maker                kafka-run-class             ksql-datagen                     schema-registry-stop-service
kafka-configs                kafka-preferred-replica-election  kafka-run-class.orig        ksql-node                        support-metrics-bundle
[root@JZJG-T-ZJJPTJZYZ-CDC-KAFKA-TEST-002 bin]# pwd
/neworiental/cdc/confluent-4.1.2/bin
[root@JZJG-T-ZJJPTJZYZ-CDC-KAFKA-TEST-002 bin]# 

执行创建scram用户的脚本命令

confluent对应的脚本是bin目录下的kafka-configs,单独的Kafka是bin目录下的kafka-configs.sh

/neworiental/cdc/confluent-4.1.2/bin/kafka-configs --zookeeper ip:port --alter --add-config 'SCRAM-SHA-256=[password=your secret],SCRAM-SHA-512=[password=your secret]' --entity-type users --entity-name admin

脚本命令里面的两个password是一样的,记住用户名和密码,一会需要用到。

创建jaas文件

在每个broker的服务器上创建jaas文件,我创建文件的目录是:/neworiental/cdc/confluent-4.1.2/etc/kafka/kafka_server_jaas.conf,后面需要指定该文件路径。

kafka_server_jaas.conf文件内容:

用户名密码为刚刚创建的

KafkaServer {
   org.apache.kafka.common.security.scram.ScramLoginModule required
   username="admin"
   password="your secret";
};

修改启动脚本

confluent对应的启动脚本是bin目录下的kafka-server-start,单独的Kafka是bin目录下的kafka-server-start.sh

方法1:

需要在启动参数中指定jaas的路径:-Djava.security.auth.login.config=你的jaas文件路径

exec $base_dir/kafka-run-class $EXTRA_ARGS -Djava.security.auth.login.config=/neworiental/cdc/confluent-4.1.2/etc/kafka/kafka_server_jaas.conf io.confluent.support.metrics.SupportedKafka "$@"

如果是单独的Kafka版本,则改为如下:

exec $base_dir/kafka-run-class.sh $EXTRA_ARGS -Djava.security.auth.login.config=/neworiental/cdc/confluent-4.1.2/etc/kafka/kafka_server_jaas.conf kafka.Kafka "$@"

没啥区别,启动的类不一样

注意:-Djava.security.auth.login.config=xxx一定要加在$EXTRA_ARGS之后。

方法2:

也可以直接在脚本最前面加上:

export KAFKA_OPTS=-Djava.security.auth.login.config=/bigdata/confluent-4.1.2/etc/kafka/kafka_server_jaas.conf
export JMX_PORT="9999"

export JMX_PORT=“9999” 这句是之后做监控用的,如不需要,可以不加

启动Kafka

当四个broker都完成以上操作之后,执行启动脚本

nohup /neworiental/cdc/confluent-4.1.2/bin/kafka-server-start /neworiental/cdc/confluent-4.1.2/etc/kafka/server.properties >/neworiental/cdc/data/kafka-log/kafka.log 2>&1 &

添加Systemd

如果要在机器启动就自动启动Kafka服务,或者Kafka挂了可以自动启动,可以继续之后的操作

编写Kafka启动、停止脚本

kafka-start.sh

#!/bin/bash

PID=`ps -ef | grep '/neworiental/cdc/confluent-4.1.2' | grep -v grep | awk '{print $2}'`
if [[ "" !=  "$PID" ]]; then
  echo "killing kafka : $PID"
  kill $PID
fi

sleep 1

/neworiental/cdc/confluent-4.1.2/bin/kafka-server-start /neworiental/cdc/confluent-4.1.2/etc/kafka/server.properties >/neworiental/cdc/data/kafka-log/kafka.log 2>&1 &
echo "kafka is starting..."

kafka-stop.sh

#!/bin/bash

PID=`ps -ef | grep '/neworiental/cdc/confluent-4.1.2' | grep -v grep | awk '{print $2}'`
if [[ "" !=  "$PID" ]]; then
  echo "killing kafka : $PID"
  kill $PID
fi

每台机器上传完脚本后,需要赋予执行权限

chmod +x kafka-start.sh kafka-stop.sh

添加Systemd

进入目录:/usr/lib/systemd/system

创建文件:kafka.service

写入以下内容:

[Unit]
Description=Apache Kafka Server
Documentation=http://kafka.apache.org/documentation.html
After=network.target
 
[Service]
User=root
Group=root
Type=forking
WorkingDirectory=/neworiental/cdc/confluent-4.1.2/
ExecStart=/neworiental/cdc/confluent-4.1.2/kafka-start.sh
ExecStop=/neworiental/cdc/confluent-4.1.2/kafka-stop.sh
RestartSec=60
Restart=always
 
[Install]
WantedBy=multi-user.target

注意:执行脚本的路径不要写错,还有脚本中必须要加:#!/bin/bash,否则会报错:code=exited, status=203/EXEC

kafka.service文件创建成功之后,执行命令启用:

[root@JZJG-T-ZJJPTJZYZ-CDC-KAFKA-TEST-003 system]# systemctl enable kafka.service
Created symlink from /etc/systemd/system/multi-user.target.wants/kafka.service to /usr/lib/systemd/system/kafka.service.
[root@JZJG-T-ZJJPTJZYZ-CDC-KAFKA-TEST-003 system]# 
[root@JZJG-T-ZJJPTJZYZ-CDC-KAFKA-TEST-003 system]# systemctl start kafka.service

Kafka监控

部署jmx_exporter

以下内容为Kafka监控相关,如不需要则跳过

四台机器都要部署

下载:https://github.com/prometheus/jmx_exporter

规则配置文件:

kafka-0-8-2.yml

#对应之前配置的JMX端口
hostPort: 127.0.0.1:9999
lowercaseOutputName: true
rules:
- pattern : kafka.cluster<type=(.+), name=(.+), topic=(.+), partition=(.+)><>Value
  name: kafka_cluster_$1_$2
  labels:
    topic: "$3"
    partition: "$4"
- pattern : kafka.log<type=Log, name=(.+), topic=(.+), partition=(.+)><>Value
  name: kafka_log_$1
  labels:
    topic: "$2"
    partition: "$3"
- pattern : kafka.controller<type=(.+), name=(.+)><>(Count|Value)
  name: kafka_controller_$1_$2
- pattern : kafka.network<type=(.+), name=(.+)><>Value
  name: kafka_network_$1_$2
- pattern : kafka.network<type=(.+), name=(.+)PerSec, request=(.+)><>Count
  name: kafka_network_$1_$2_total
  labels:
    request: "$3"
- pattern : kafka.network<type=(.+), name=(\w+), networkProcessor=(.+)><>Count
  name: kafka_network_$1_$2
  labels:
    request: "$3"
  type: COUNTER
- pattern : kafka.network<type=(.+), name=(\w+), request=(\w+)><>Count
  name: kafka_network_$1_$2
  labels:
    request: "$3"
- pattern : kafka.network<type=(.+), name=(\w+)><>Count
  name: kafka_network_$1_$2
- pattern : kafka.server<type=(.+), name=(.+)PerSec\w*, topic=(.+)><>Count
  name: kafka_server_$1_$2_total
  labels:
    topic: "$3"
- pattern : kafka.server<type=(.+), name=(.+)PerSec\w*><>Count
  name: kafka_server_$1_$2_total
  type: COUNTER

- pattern : kafka.server<type=(.+), name=(.+), clientId=(.+), topic=(.+), partition=(.*)><>(Count|Value)
  name: kafka_server_$1_$2
  labels:
    clientId: "$3"
    topic: "$4"
    partition: "$5"
- pattern : kafka.server<type=(.+), name=(.+), topic=(.+), partition=(.*)><>(Count|Value)
  name: kafka_server_$1_$2
  labels:
    topic: "$3"
    partition: "$4"
- pattern : kafka.server<type=(.+), name=(.+), topic=(.+)><>(Count|Value)
  name: kafka_server_$1_$2
  labels:
    topic: "$3"
  type: COUNTER

- pattern : kafka.server<type=(.+), name=(.+), clientId=(.+), brokerHost=(.+), brokerPort=(.+)><>(Count|Value)
  name: kafka_server_$1_$2
  labels:
    clientId: "$3"
    broker: "$4:$5"
- pattern : kafka.server<type=(.+), name=(.+), clientId=(.+)><>(Count|Value)
  name: kafka_server_$1_$2
  labels:
    clientId: "$3"
- pattern : kafka.server<type=(.+), name=(.+)><>(Count|Value)
  name: kafka_server_$1_$2

- pattern : kafka.(\w+)<type=(.+), name=(.+)PerSec\w*><>Count
  name: kafka_$1_$2_$3_total
- pattern : kafka.(\w+)<type=(.+), name=(.+)PerSec\w*, topic=(.+)><>Count
  name: kafka_$1_$2_$3_total
  labels:
    topic: "$4"
  type: COUNTER
- pattern : kafka.(\w+)<type=(.+), name=(.+)PerSec\w*, topic=(.+), partition=(.+)><>Count
  name: kafka_$1_$2_$3_total
  labels:
    topic: "$4"
    partition: "$5"
  type: COUNTER
- pattern : kafka.(\w+)<type=(.+), name=(.+)><>(Count|Value)
  name: kafka_$1_$2_$3_$4
  type: COUNTER
- pattern : kafka.(\w+)<type=(.+), name=(.+), (\w+)=(.+)><>(Count|Value)
  name: kafka_$1_$2_$3_$6
  labels:
    "$4": "$5"

启动脚本

#!/bin/sh
. /etc/profile

PID=`ps -ef | grep 'jmx_prometheus_httpserver-0.14.1-SNAPSHOT-jar-with-dependencies.jar' | grep -v grep | awk '{print $2}'`
if [[ "" !=  "$PID" ]]; then
  echo "killing kafka : $PID"
  kill $PID
fi

sleep 1

nohup java -Dcom.sun.management.jmxremote.ssl=false -Dcom.sun.management.jmxremote.authenticate=false -Dcom.sun.management.jmxremote.port=5555 -jar ./jmx_prometheus_httpserver-0.14.1-SNAPSHOT-jar-with-dependencies.jar 5556 ./kafka-0-8-2.yml >./jmx.log 2>&1 &

目录结构:

[root@JZJG-T-ZJJPTJZYZ-CDC-KAFKA-TEST-002 jmx_prometheus_exporter]# ll
total 404
-rw-r--r-- 1 root root 404199 Jan 22 19:03 jmx_prometheus_httpserver-0.14.1-SNAPSHOT-jar-with-dependencies.jar
-rw-r--r-- 1 root root   2845 Jan 22 19:02 kafka-0-8-2.yml
-rwxr-xr-x 1 root root    270 Feb  4 17:54 start.sh
[root@JZJG-T-ZJJPTJZYZ-CDC-KAFKA-TEST-002 jmx_prometheus_exporter]# 

给启动脚本赋执行权限:

chmod +x start.sh

启动jmx_exporter:

./start.sh

检验是否启动成功:端口号对应启动脚本中jar包后面的数字

以上就说明启动成功了,并且根据配置的规则拉取信息了

记住四台机器上都要部署

配置Prometheus

安装prometheus和grafana的内容,本篇文章先不做介绍,不是很难,可以自行查阅,主要讲配置。

将四台机器的jmx_exporter配置到prometheus的job中

- job_name: 'kafka_jmx_exporter'
  static_configs:
  - targets: ['172.24.29.122:5556','172.24.29.128:5556','172.24.29.129:5556','172.24.29.130:5556']

配置完之后,在Prometheus的targets页面能看到新加的job

配置Grafana

我使用的Grafana是之前搭建好的,Prometheus对应的datasourse也配置好了,直接配置dashboard即可。

配置dashboard

先下载dashboard模版:https://grafana.com/grafana/dashboards?search=jmx_exporter

复制dashboard id

在grafana中创建dashboard

设置参数

最后点击import 完成dashboard导入

注意:因为grafana版本的问题,有些图表可能会不支持显示,此时需要升级grafana或者自定义图表,比如我用的是6.x的版本,出现以下情况:

此时不要慌,数据是已经采集到了,只是没有显示而已,可以编辑该部分,进行自定义(下图是我调整好的效果)

可以选择视图,我这块显示的是表格,所以选table,然后可以自定义每一列,包括是否显示、类型、转换、颜色、显示名字等等,编辑完之后,点击右上方的保存按钮即可

所以最后的效果图:

完美了,收工,回家过年。

后记

搭建的过程会遇到挺多问题,但是只有真正遇到问题,解决问题,才能成长,如果只是看书、学历理论,不做实践,终究是纸上谈兵,把整个过程捋了一遍,以后也会有经验,并且将过程记录下来,会大大加深印象,只有多锻炼,多实践,才能慢慢地独当一面。

Guess you like

Origin blog.csdn.net/sinat_14840559/article/details/113700093