Centons7下安装配置Flume、Linux下安装配置Flume、Flume的简单使用示例、Flume整合Kafka使用

本篇文章主要介绍在windows下使用vmware虚拟机中的Linux(Centons7)下配置安装Flume。

目前Flume 的最新版本为1.8,笔者安装的是1.6,是Flume的一个经典版本,通常在生产环境中使用的就是这个版本,在安装Flume前,看先它的前置条件 

(1).JDK1.8 

(2).足够的内存 

(3).足够的磁盘空间 

(4).目录及文件要有读写权限

简要步骤:

①、下载Flume解压包

②、解压Flume

③、修改配置文件

④、配置环境变量

⑤、使用Flume帮助命令、查看版本

⑥、启动Flume

⑦、使用Flume

⑧、Flume整合Kafka使用


详细步骤:

一、Flume下载

从官网下载,或者在linux中使用下面的命令下载,然后解压

方式1:官网下载地址:http://archive.apache.org/dist/flume/ 

方式2:如果提示没有 wget 命令, 则使用如下命令安装即可 ,yum install wget # 使用 root 用户安装

wget http://archive.apache.org/dist/flume/1.6.0/apache-flume-1.6.0-bin.tar.gz

二、解压

 tar -zxvf apache-flume-1.6.0-bin.tar.gz 

 三、修改配置文件

①进入flume的conf目录下,拷贝flume-env.sh.template然后重命名为flume-env.sh(图1)

cp flume-env.sh.template flume-env.sh

②在flume-env.sh中配置jdk

vim flume-env.sh

export JAVA_HOME=/usr/java/jdk1.8.0_151

四、配置环境变量

vim ~/.bashrc 
source ~/.bashrc 


# Flume Environment Variable
export FLUME_HOME=/usr/local/devtool/apache-flume-1.6.0-bin

export PATH=$PATH:$FLUME_HOME/bin

完整环境变量 


# Uncomment the following line if you don't like systemctl's auto-paging feature:
# export SYSTEMD_PAGER=

# User specific aliases and functions
export JAVA_HOME=/usr/java/jdk1.8.0_151
export HADOOP_HOME=/usr/local/hadoop        # hadoop的安装目录,替换为你的hadoop的安装目录
export HADOOP_INSTALL=$HADOOP_HOME
export HADOOP_MAPRED_HOME=$HADOOP_HOME
export HADOOP_COMMON_HOME=$HADOOP_HOME
export HADOOP_HDFS_HOME=$HADOOP_HOME
export YARN_HOME=$HADOOP_HOME
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
export PATH=$PATH:$HADOOP_HOME/sbin:$HADOOP_HOME/bin
# Zookeeper Environment Variable
export ZOOKEEPER_HOME=/usr/local/devtool/zookeeper-3.4.10
# Flume Environment Variable
export FLUME_HOME=/usr/local/devtool/apache-flume-1.6.0-bin




export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/sbin:$HADOOP_HOME/bin:$ZOOKEEPER_HOME/bin:$FLUME_HOME/bin

五、查看Flume 的命令帮助

flume-ng help

 查看版本信息

flume-ng version

六、启动Flume

./bin/flume-ng agent -n agent -c conf -f conf/flume-conf.properties.template -Dflume.root.logger=INFO,console

参数说明: 

–conf:指定flume的配置文件所在目录 

–name:指定Agent的名称 

–conf-file:指定编写的flume配置文件 

-Dflume.root.logger:指定日志级别

flume启动后,打印的日志中可以看到如下信息(部分日志)

输入jps命令可以查看到一个Application的进程,如果有这个进程,说明我们的flume启动成功了

七、简单使用Flume

测试(启动一个telnet进程,telnet 数据输入)

telnet node1 44444

启动后在这里输入完按回车去flume控制台查看输出即可

查看Flume控制台的输出(Event是Flume数据传输的基本单元,由可选的header和一个byte array的数据构成)

2018-08-08 13:55:58,446 (SinkRunner-PollingRunner-DefaultSinkProcessor) [INFO - org.apache.flume.sink.LoggerSink.process(LoggerSink.java:94)] Event: { headers:{} body: 68 65 6C 6C 6F 0D                               hello. }
2018-08-08 13:55:58,447 (SinkRunner-PollingRunner-DefaultSinkProcessor) [INFO - org.apache.flume.sink.LoggerSink.process(LoggerSink.java:94)] Event: { headers:{} body: 77 6F 72 6C 64 0D                               world. }

八、Flume整合Kafka使用

猜你喜欢

转载自blog.csdn.net/zjh_746140129/article/details/83832862