HA flume 高可用集群的搭建与使用 - 代码天地

HA flume 高可用集群的搭建与使用

其他 2018-09-14 21:34:48 阅读次数: 0

HA Flume流程图

搭载详细流程

在 flume1的sink中设置一个组group，这个组里面有两个sink，sink1和sink2.其中sink1负责把数据下沉到flume2。

Sink2负责把数据下沉到flume3。并且设置优先级，比如设置sink1的优先级为1000，设置sink2的优先级为10，谁的优先级大，谁负责采集数据。最后设置一个乘法因子，设置为1000，当优先级高的机器宕机时，优先级要减去乘法因子，比如本案例，sink1宕机后，优先级变成 1000-1000=0，此时sink2的优先级高，则又sink2负责把数据下沉到flume3，当flume2恢复好时，又会立即工作。

设置组的处理类型为 failover，可选的还有load_balance和default，也就是k1、k2在使用过程中只有一个可用，且k1优先级高于k2，如果k1宕机之后恢复之后，可以使用的仍然是k1，而不是k2。

(说明，惩罚因子和优先级的设置是随便，只要能区分说的优先级高就行)。

采集方案

Flume2和flume3 的采集方案：这两个是一样的，都是采集flume1的数据，然后下沉到hdfs

a1.sources.r1.bind = wangzhihua3

a1.sources.r1.interceptors.i1.value = wangzhihua3

这两个必须一样

a1.sources = r1

a1.channels = c1

a1.sinks = k1

#set channel

a1.channels.c1.type = memory

a1.channels.c1.capacity = 1000

a1.channels.c1.transactionCapacity = 100

# other node,nna to nns

a1.sources.r1.type = avro

a1.sources.r1.bind = wangzhihua3

a1.sources.r1.port = 52020

a1.sources.r1.interceptors = i1

a1.sources.r1.interceptors.i1.type = static

a1.sources.r1.interceptors.i1.key = Collector

a1.sources.r1.interceptors.i1.value = wangzhihua3

a1.sources.r1.channels = c1

#set sink to hdfs

a1.sinks.k1.type=hdfs

a1.sinks.k1.hdfs.path=/home/hdfs/flume/logdfs

a1.sinks.k1.hdfs.fileType=DataStream

a1.sinks.k1.hdfs.writeFormat=TEXT

a1.sinks.k1.hdfs.rollInterval=10

a1.sinks.k1.channel=c1

a1.sinks.k1.hdfs.filePrefix=%Y-%m-%d

Flume1 的采集方案：设置一个sink组：g1，组内有两个sink1和sink2.分别下沉到flume2，flume3

#agent的名字

a1.channels = c1

a1.sources = r1

a1.sinks = k1 k2

#设置sink组

a1.sinkgroups = g1

#设置 channel

a1.channels.c1.type = memory

a1.channels.c1.capacity = 1000

a1.channels.c1.transactionCapacity = 100

a1.sources.r1.channels = c1

a1.sources.r1.type = exec

a1.sources.r1.command = tail -F /root/test.log

a1.sources.r1.interceptors = i1 i2

a1.sources.r1.interceptors.i1.type = static

a1.sources.r1.interceptors.i1.key = Type

a1.sources.r1.interceptors.i1.value = LOGIN

a1.sources.r1.interceptors.i2.type = timestamp

# 设置下沉组件 sink1，将端口绑定到wangzhihua2上的52020

a1.sinks.k1.channel = c1

a1.sinks.k1.type = avro

a1.sinks.k1.hostname = wangzhihua2

a1.sinks.k1.port = 52020

# 设置下沉组件 sink2 ，将端口绑定到wangzhihua3上的52020

a1.sinks.k2.channel = c1

a1.sinks.k2.type = avro

a1.sinks.k2.hostname =wangzhihua3

a1.sinks.k2.port = 52020

#设置 sink group

a1.sinkgroups.g1.sinks = k1 k2

#设置组的处理类型为 failover，可选的还有load_balance和default

#k1、k2在使用过程中只有一个可用，且k1优先级高于k2，如果k1宕机之后恢复之后

#可以使用的仍然是k1，而不是k2

a1.sinkgroups.g1.processor.type = failover

a1.sinkgroups.g1.processor.priority.k1 = 10

a1.sinkgroups.g1.processor.priority.k2 = 1

a1.sinkgroups.g1.processor.maxpenalty = 10000

猜你喜欢

转载自blog.csdn.net/aA518189/article/details/80888306

HA flume 高可用集群的搭建与使用

HA高可用集群搭建

集群-高可用-HA

postgresql使用RHCS套件搭建HA高可用集群

Hadoop HA 高可用集群部署搭建

Linux下搭建HA高可用集群

Hadoop HA高可用集群搭建

Hadoop HA高可用集群搭建（2.7.2）

Spark HA(高可用)集群的搭建

YARN-HA高可用集群搭建

Hadoop搭建高可用的HA集群

Hadoop集群HA(高可用)搭建

【HA高可用的搭建】

Flume NG高可用集群搭建

Hbase 使用高可用（HA）的hadoop集群

Hadoop高可用集群（HA）

高可用（HA）集群构建

Hadoop集群的高可用-HA

搭建Hadoop分布式集群、HA高可用集群

Flink 集群搭建,Standalone,集群部署,HA高可用部署

海量日志采集Flume(HA)

hadoop高可用HA的搭建

HA搭建hadoop的高可用

flume高可用集群安装

hadoop HA高可用性集群搭建

Kubernetes1.10HA高可用集群环境搭建

linux -- 基于zookeeper搭建yarn的HA高可用集群

Hadoop2.3-HA高可用集群环境搭建

hadoop2.6.4-ha高可用集群搭建

Redis Cluster高可用(HA)集群环境搭建详细步骤

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)