Flume的学习 - 代码天地

Flume的学习

其他 2020-10-03 18:56:44 阅读次数: 0

FLume是一个高可用的高可靠的分布式的海量日志采集，聚合和传输的系统.

flume最主要的作用就是实时读取服务器本地磁盘的数据，将数据写入到hdfs中．
flume的主要架构
在这里插入图片描述
Source 数据输入端的常见类型有　spooling directory exec ,syslog avro等
put事物流程
doput 将批数据先写入到缓冲区putlist中，
doCommit 检查channel内存队列是否足够合并
doRollback channel内存队列空间不足，回滚数据

Channel自带两种Channel Memeory Channel 和File Channel
Memory Channel 是基于内存缓存，在不需要关心数据丢失的情景下使用．
File Channel 是flume持久化Channel系统宕机不会丢失数据

Take 事务
doTake:先将数据取到临时缓冲区takeList•
doCommit:如果数据全部发送成功，则清除临时缓冲区takeList•
doRollback:数据发送过程中如果出现异常，rollback将临时缓冲区takeList中的数据归还给channel内存队列

Sink 组建常见的目的地包括HDFS,kafka

猜你喜欢

转载自blog.csdn.net/qq_43079376/article/details/108124452

Flume的学习

Flume学习

flume部分：flume的学习（全）

Flume学习之路（二）Flume的配置方式

Flume学习之路（二）Flume的Source类型

Flume学习（二）Flume的Source类型

Flume学习（一）Flume的基础介绍

Flume学习（三）Flume的配置方式

Flume学习之路（三）Flume的配置方式

Flume学习之路（一）Flume的基础介绍

Flume学习笔记（一） Flume概览与架构

Flume学习笔记（2）—— Flume进阶

Flume学习笔记（1）—— Flume入门

Flume基础学习笔记

Flume学习（一）

Flume学习笔记

Flume学习总结

学习笔记-Flume

sqoop flume学习笔记

flume 学习总结

flume 学习笔记（1）

flume的学习过程

学习笔记--Flume

Flume学习06 — SDK

Flume学习05

Flume学习04 — Sink

Flume学习03 — Channel

Flume学习02 — Source

Flume学习01

flume学习随笔

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

女程序员是这样被恶搞的

B/S 和 C/S 的优缺点

vector一直申请会怎样？

座头鲸识别比赛(Humpback Whale Identification)总结

Linux高性能服务器编程——I/O复用 select

Mysql连接数据库（当包使用）

通过URI获取的文件路径为null的解决方法

1022-Primes on Interval(素数筛选+二分查找) ZCMU

Python出现： TypeError: expected string or buffer

bzoj2434: [Noi2011]阿狸的打字机 ac自动机+树状数组

每日归档

更多

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)