flume使用taildir，监控多个文件夹下的多个文件 - 代码天地

flume使用taildir，监控多个文件夹下的多个文件

其他 2020-03-25 18:08:48 阅读次数: 0

在flume1.6版本及之前，如果想要监控多个目录下的多个文件，可以使用Filelistener，在flume1.7之后，增加了TAILDIR，主要是监控文件的变化
下面介绍taildir的使用：
第一步：在flume中创建conf配置文件，我的是创建在：flume下的job文件夹中，job文件夹是我自定义的用来存放conf配置文件的：
/opt/module/flume/job/flume-file-kafka3.conf
内容如下：

a1.sources = r1
a1.channels = c1

a1.sources.r1.type = TAILDIR
#偏移量文件
a1.sources.r1.positionFile = /opt/module/flume/data/taildir_position.json
#文件的组，可以定义多种
a1.sources.r1.filegroups = f1 f2
#第一组监控的是test1文件夹中的什么文件：.log文件
a1.sources.r1.filegroups.f1 = /opt/module/flume/data/test1/.*log
#下面这句可以不要
#a1.sources.r1.headers.f1.headerKey1 = value1
#第二组监控的是test2文件夹中的什么文件：以.txt结尾的文件
a1.sources.r1.filegroups.f2 = /opt/module/flume/data/test2/.*txt

#下面两句可以不要
#a1.sources.r1.headers.f2.headerKey1 = value2
#a1.sources.r1.headers.f2.headerKey2 = value2-2
#a1.sources.r1.fileHeader = true
#a1.sources.ri.maxBatchCount = 1000

a1.channels.c1.type = org.apache.flume.channel.kafka.KafkaChannel
a1.channels.c1.kafka.bootstrap.servers = myhadoop101:9092,myhadoop102:9092,myhadoop103:9092
a1.channels.c1.kafka.topic = taildir
a1.channels.c1.kafka.consumer.group.id = taildir-consumer

a1.sources.r1.channels = c1

第二步：将/opt/module/flume/data/test1/.*log和 /opt/module/flume/data/test2/.*txt 这两种文件创建好

第三步：开启flume监控命令

bin/flume-ng agent --conf conf/ --name a1 --conf-file job/flume-file-kafka3.conf -Dflume.root.logger=INFO,console

我的是将kafka作为了channel使用，所以我的配置文件中并没有关于sink的设置

第四步：可以开启一个消费者，从指定topic中获取数据，来检测是否taildir起作用
总结：使用taildir，flume可以同时监控多个文件夹下的多个文件

站内首发文章

NewBee.Mu

发布了189 篇原创文章 · 获赞 13 · 访问量 1万+

私信关注

猜你喜欢

转载自blog.csdn.net/NewBeeMu/article/details/103061014

flume使用taildir，监控多个文件夹下的多个文件

flume-taildir监控多目录下多个追加文件，并且实现断点续传

使用opencv3.2读取文件夹下多个图像

flume采集多个文件夹日志

使用Python将多个文件夹下的多个文件复制到制定文件夹中（汇总）

windons bat合并多个文件夹下文件

合并一个文件夹下多个文件内容

MapReduce设置输出文件到多个文件夹下

使用python进行某文件夹下多个txt文件的读取操作

eclipse 多个项目放在一个文件夹下

eclipse把多个项目放在一个文件夹下

Python - 调用接口合并文件夹下多个Excel表

复制文件夹下的多个同名文件到新文件夹并随机重命名

Linux移动文件夹下的多个文件到另一个文件夹

大数据之Flume：实时监控多个文件

大数据之Flume：监控多个新文件

MATLAB读取一个文件夹下的多个子文件夹中的多个指定格式的文件

java监控文件夹下的文件变化使用jnotify

VBA合并文件夹下多个文件并提取每个文件的文件名

一个文件夹下多个sheet多个excel获取并清洗

eclipse如何把多个项目放在文件夹下，用文件夹分开不同的项目

pandas合并文件夹下带有多个sheet的xlxs文件并写出csv文件

c++ 连续读取某个文件夹下面的多个文件

python将一个文件夹下多个文件合并

合并同一文件夹下多个excel文件

把一个文件夹下的多个csv文件合并到一个excel的多个sheet

windows文件监控监控文件夹下文件的变化 ReadDirectoryChangesW的使用( C++ )

【Flume】Flume Taildir Source监听实时追加内容的文件

创建多个文件夹

eclipse如何把多个项目放在一个文件夹下

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)