本篇文章主要介绍在windows下使用vmware虚拟机中的Linux(Centons7)下配置安装Flume。
目前Flume 的最新版本为1.8,笔者安装的是1.6,是Flume的一个经典版本,通常在生产环境中使用的就是这个版本,在安装Flume前,看先它的前置条件
(1).JDK1.8
(2).足够的内存
(3).足够的磁盘空间
(4).目录及文件要有读写权限
简要步骤:
①、下载Flume解压包
②、解压Flume
③、修改配置文件
④、配置环境变量
⑤、使用Flume帮助命令、查看版本
⑥、启动Flume
⑦、使用Flume
⑧、Flume整合Kafka使用
详细步骤:
一、Flume下载
从官网下载,或者在linux中使用下面的命令下载,然后解压
方式1:官网下载地址:http://archive.apache.org/dist/flume/
方式2:如果提示没有 wget 命令, 则使用如下命令安装即可 ,yum install wget # 使用 root 用户安装
wget http://archive.apache.org/dist/flume/1.6.0/apache-flume-1.6.0-bin.tar.gz
二、解压
tar -zxvf apache-flume-1.6.0-bin.tar.gz
三、修改配置文件
①进入flume的conf目录下,拷贝flume-env.sh.template然后重命名为flume-env.sh(图1)
cp flume-env.sh.template flume-env.sh
②在flume-env.sh中配置jdk
vim flume-env.sh
export JAVA_HOME=/usr/java/jdk1.8.0_151
四、配置环境变量
vim ~/.bashrc
source ~/.bashrc
# Flume Environment Variable
export FLUME_HOME=/usr/local/devtool/apache-flume-1.6.0-bin
export PATH=$PATH:$FLUME_HOME/bin
完整环境变量
# Uncomment the following line if you don't like systemctl's auto-paging feature:
# export SYSTEMD_PAGER=
# User specific aliases and functions
export JAVA_HOME=/usr/java/jdk1.8.0_151
export HADOOP_HOME=/usr/local/hadoop # hadoop的安装目录,替换为你的hadoop的安装目录
export HADOOP_INSTALL=$HADOOP_HOME
export HADOOP_MAPRED_HOME=$HADOOP_HOME
export HADOOP_COMMON_HOME=$HADOOP_HOME
export HADOOP_HDFS_HOME=$HADOOP_HOME
export YARN_HOME=$HADOOP_HOME
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
export PATH=$PATH:$HADOOP_HOME/sbin:$HADOOP_HOME/bin
# Zookeeper Environment Variable
export ZOOKEEPER_HOME=/usr/local/devtool/zookeeper-3.4.10
# Flume Environment Variable
export FLUME_HOME=/usr/local/devtool/apache-flume-1.6.0-bin
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/sbin:$HADOOP_HOME/bin:$ZOOKEEPER_HOME/bin:$FLUME_HOME/bin
五、查看Flume 的命令帮助
flume-ng help
查看版本信息
flume-ng version
六、启动Flume
./bin/flume-ng agent -n agent -c conf -f conf/flume-conf.properties.template -Dflume.root.logger=INFO,console
参数说明:
–conf:指定flume的配置文件所在目录
–name:指定Agent的名称
–conf-file:指定编写的flume配置文件
-Dflume.root.logger:指定日志级别
flume启动后,打印的日志中可以看到如下信息(部分日志)
输入jps命令可以查看到一个Application的进程,如果有这个进程,说明我们的flume启动成功了
七、简单使用Flume
测试(启动一个telnet进程,telnet 数据输入)
telnet node1 44444
启动后在这里输入完按回车去flume控制台查看输出即可
查看Flume控制台的输出(Event是Flume数据传输的基本单元,由可选的header和一个byte array的数据构成)
2018-08-08 13:55:58,446 (SinkRunner-PollingRunner-DefaultSinkProcessor) [INFO - org.apache.flume.sink.LoggerSink.process(LoggerSink.java:94)] Event: { headers:{} body: 68 65 6C 6C 6F 0D hello. }
2018-08-08 13:55:58,447 (SinkRunner-PollingRunner-DefaultSinkProcessor) [INFO - org.apache.flume.sink.LoggerSink.process(LoggerSink.java:94)] Event: { headers:{} body: 77 6F 72 6C 64 0D world. }