Hadoop:Flume实时日志采集组件集成搭建

环境:

  • VMware15.5
  • hadoop-2.6.0-cdh5.14.0
  • jdk1.8
  • apache-flume-1.8.0

Flume安装部署:

  1. Flume的安装非常简单
  • 上传安装包到数据源所在节点上

  • 然后解压  tar -zxvf apache-flume-1.8.0.tar.gz

  • 然后进入flume的解压目录,修改conf下的flume-env.sh,在里面配置JAVA_HOME(记得保存)

这就算安装成功了。。。。。。


   开始使用flume

  1. 根据数据采集需求配置采集方案,描述在配置文件中(文件名可任意自定义)
  2. 指定采集方案配置文件,在相应的节点上启动flume agent

先在flumeconf目录下新建一个文件

vim  安装路径/apache-flume-1.6.0-cdh5.14.0-bin/conf/netcat-logger.conf

# 定义这个agent中各组件的名字

a1.sources = r1

a1.sinks = k1

a1.channels = c1

 

# 描述和配置source组件:r1

a1.sources.r1.type = netcat

a1.sources.r1.bind = 192.168.52.120

a1.sources.r1.port = 44444

 

# 描述和配置sink组件:k1

a1.sinks.k1.type = logger

 

# 描述和配置channel组件,此处使用是内存缓存的方式

a1.channels.c1.type = memory

a1.channels.c1.capacity = 1000

a1.channels.c1.transactionCapacity = 100

 

# 描述和配置source  channel   sink之间的连接关系

a1.sources.r1.channels = c1

a1.sinks.k1.channel = c1

Channel参数解释:

capacity:默认该通道中最大的可以存储的event数量

trasactionCapacity:每次最大可以从source中拿到或者送到sink中的event数量

启动配置文件:

启动agent去采集数据

bin/flume-ng agent -c conf -f conf/netcat-logger.conf -n a1  -Dflume.root.logger=INFO,console

-c conf   指定flume自身的配置文件所在目录

-f conf/netcat-logger.con  指定我们所描述的采集方案

-n a1  指定我们这个agent的名字

发布了24 篇原创文章 · 获赞 75 · 访问量 1万+

猜你喜欢

转载自blog.csdn.net/dlc_996/article/details/104235836