部署数据环境(flume) - 代码天地

部署数据环境(flume)

其他 2018-05-10 19:54:02 阅读次数: 3

flume连接kafka

flume(日志收集器):通过一个配置文件定义一个代理

配置文件:

(1).source ：从哪里过来

(2).sink：数据流向哪里

(3)通道:通过通道输出。使用内存传数据比较慢。如果数据传的快过内存，就会堵塞，为了解决瓶颈问题，我们使用kafka,kafka输出的比较块。但是如果通过网络传输就会慢下来。所以这个时候就有另外一办法解决这个问题。就是收集日志，定义一堆分支，集群式分支，就会缓解数据输出愉而造成的堵塞。

kafka(发布订阅的)订阅flume发过来的数据。自己也可以编个程序也可以，所以flume有个瓶颈问题，很多企业不用flume而是直接自己编程序，使用kafka，因为kafka是scale语方编写的，所以不同版本之间不兼容，所以spark是什么版本的就用什么版本的kafka。

爬虫爬出来的数据给kafka

接下来配置环境：

首先配置一个监听文件的

flume最主要的是:

agent:

source: type(监控文件，监控目录，thirft,avro,网络)

channle(通道): type:内存

sink: type:kafka,hdfs,mysql等等

1.打开后虚拟机，xshell上传文件

然后解压

在conf添加一个配置文件，文件名是自己随便写http://flume.apache.org 进入flume官网

然后配置a1.conf 文件：

./bin/flume-ng agent -c conf -f conf/aa.conf -n a1 -Dflume.root.logger=INFO,console 执行这句，记住一定要在bin目录下

我们测试一下:用telnet 虚拟机没有telnet所以连不上，我们用windows系统连拉，复制一个ssh通道

到执行bin 那个shell页看下有没有发过去，看到hellow 就成功了

接下来我们试着不观察网络，观察文件

vi aa.conf

完成之后还是利用上方的方式把它启动

./bin/flume-ng agent -c conf -f conf/aa.conf -n a1 -Dflume.root.logger=INFO,console

只要往文件里边加内容就会被收走

以上是两种监控，一个网络，一个是文件，接下来实现监控目录：

首先新建一个test目录用来测试的

停止flume agent(ctrl+c),然后重新配置 aa.conf 文件

到官网上找到

往下看实例

还是用上方方法启动

被日志收集器收完了就重命名了

日志不是产生一条就收起，一天的日志，到1点时把这个日志挪到这个目录，一天统一收走

猜你喜欢

转载自blog.csdn.net/baiyan_er/article/details/80057414

部署数据环境(flume)

Flume环境部署

Flume 环境安装部署

19、大数据之Flume和Flume的安装部署

【flume】flume的部署及案例

flume部署

Flume数据采集概述、结构、环境搭建

Flume环境部署和配置详解及案例(转)

Flume环境部署和配置详解及案例大全

大数据组件flume部署安装与测试练习

大数据环境部署

flume的安装部署

Flume 1.5.0简单部署

Flume插件开发及部署

Flume安装及简单部署

Flume NG部署

Flume安装部署

Flume简介及部署、测试

Flume安装部署教程

【Flume】之安装部署

flume安装与监控部署

Flume 的几种部署方案

Flume的部署与使用

FLUME的部署和安装

flume 1.8 安装部署

Flume —— 安装部署

2 安装部署flume

flume安装与部署

Apache Flume安装部署

【Flume】数据采集引擎Flume

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)