hadoop日志系统中的日志收集模块 - 代码天地

hadoop日志系统中的日志收集模块

企业开发 2018-05-11 06:47:23 阅读次数: 1

hadoop日志系统中的日志收集模块，在如今比较流行的以及开源具有代表性的有facebook的scribe，apache的chukwa，linkedin的kafka，以及非常优秀的cloudrea的flume，在1.x的hadoop生态系统中，flume比较适合做日志收集模块，因为其功能全面，且具有高扩展性，高稳定性，高可靠性，以及便于管理和维护。

在1.xhadoop生态系统中，HDFS分布式文件存储系统，和Hbase分布式面向列的数据库，适合存储海量日志信息，HDFS，因为具有良好的扩展性，高容错性，高可靠性，所以适合海量日志信息的存储，Hbase因具有高可靠性，高性能，面向列以及良好的扩展性，且支持实时存储数据，结合HDFS作为底层的分布式存储系统，所以也适合存储海量日志信息

日志模块分析工具有Hive，Pig，Mahout，Hive的适用场景通常用于结构化海量日志的离线数据统计问题。Pig适用于ad-hoc在Query时离线数据分析工具。Mahout适用于对海量数据的机器学习和数据挖掘工作。

Hbase适合实时存读取网站的更新频率信息。
Hive和Pig适合完成网页去重复功能。
可以使用MapReduce分布式计算框架辅以hive，pig，mahout对网页进行处理和分析。

二，Cloudrea的flume日志收集模块，分为三层架构，分别位agent，collector，storage，agent和collector又由二部分组成，source和sink，source代表日志的数据源，sink代表数据方向，

参数

作用

agent

将数据源发送给collector统一处理

collector

将日志数据收集后汇总，交给HDFS存储

stroage

是存储系统，可以是数据库，简单的txt，HDFS,以及Hbase等等

简易流程图如下：

猜你喜欢

转载自weitao1026.iteye.com/blog/2267075

hadoop日志系统中的日志收集模块

Hadoop-模拟搭建日志收集系统

日志收集系统架构

日志收集系统

ELK 日志收集系统

系统日志收集系列

Flume日志收集系统

ELK日志收集系统

Hadoop 2.0中的日志收集以及配置方法

Hadoop 2.0中作业日志收集原理以及配置方法

Apiclude中Talkingdata模块异常日志不能收集问题

Golang实战之海量日志收集系统（二）收集应用程序日志到Kafka中

kafka + elk 日志收集系统

ELK日志收集系统搭建

Android平台日志收集系统

模拟搭建日志收集系统

日志收集系统搭建-BELK

golang（11）：日志收集系统

elk日志收集系统实战

Flume---日志收集系统

Loki搭建日志收集系统

ELK 日志收集系统方案

ELK日志收集系统部署

ELK日志收集系统概述

flume+hadoop日志收集集群搭建

hadoop系列：日志收集工具flume

Golang实战之海量日志收集系统（七）logTransfer之从kafka中获取日志信息

日志收集

Django的日志中关闭elasticsearch模块的日志

网站日志流量分析系统之（日志收集）

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)