大数据项目之电信客服三 - 代码天地

大数据项目之电信客服三

其他 2018-12-16 09:20:59 阅读次数: 0

1.启动Kafaka集群

这里的Kafka集群搭建就不再说了，如果不会搭建可以看我之前的博文

首先启动Zookeeper集群，然后再启动Kafka集群

bin/zkServer.sh start
bin/kafka-server-start.sh config/server.properties

2.创建Kafka主题

bin/kafka-topics.sh --zookeeper cdh0:2181 --create --replication-factor 3 --partitions 3 --topic ctlog

3.查看Kafka主题是否创建成功

bin/kafka-topics.sh --zookeeper cdh0:2181 --list

4.启动一个Kafka的消费者，等待Flume的信息的输入

bin/kafka-console-consumer.sh --bootstrap-server cdh0:9092 --topic ctlog --from-beginning

5.配置Flume

创建ct_log.conf

# define
a1.sources = r1
a1.sinks = k1
a1.channels = c1
# source
a1.sources.r1.type = exec
a1.sources.r1.command = tail -F -c +0 /opt/package/log.csv
a1.sources.r1.shell = /bin/bash -c
# sink
a1.sinks.k1.type = org.apache.flume.sink.kafka.KafkaSink
a1.sinks.k1.brokerList = cdh0:9092,cdh1:9092,cdh2:9092
a1.sinks.k1.topic = ctlog
a1.sinks.k1.batchSize = 20
a1.sinks.k1.requiredAcks = 1
# channel
a1.channels.c1.type = memory
a1.channels.c1.capacity = 1000
a1.channels.c1.transactionCapacity = 100
# bind
a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1

6.运行Flume

$ bin/flume-ng agent --conf conf/ --name a1 --conf-file testjob/ct_log.conf

到这里基本就稳了，前面的生产数据代码在生产数据，Flume监控产生数据的文件并将数据传到Kafka，Kafka进行消费

这时候应该可以在Kafka的消费端看到数据的输出

猜你喜欢

转载自blog.csdn.net/ys_230014/article/details/84637766

大数据项目之电信客服三

大数据项目之电信客服二

大数据项目之电信客服一

大数据项目之_15_电信客服分析平台_03&04_数据分析

大数据项目实战之电信大数据项目

大数据项目之_15_电信客服分析平台_01&02_项目背景+项目架构+项目实现+数据生产+数据采集/消费(存储)

大数据项目之数据采集总结（三）

大数据开发实战系列之电信客服(1)

大数据项目

[大数据项目]-0009-大数据项目之Spark实时流计算项目

大数据项目（二）————某电信公司通话记录改造

大数据项目（三）————电商项目介绍（一）

大数据项目（三）————电商模块二（三）

大数据项目（三）————电商模块三（四）

大数据项目实战之 --- 某购物平台商品实时推荐系统（三）

大数据项目之电影推荐系统（三）统计推荐模块

大数据项目之业务数据采集(二)

我的大数据项目

大数据项目（三）————电商模块四（五）

大数据项目实战必备技能之Spark

腾讯阿里大数据项目之Greenplum集群

大数据项目之dmp用户画像

大数据项目实战之 --- 某App管理平台的手机app日志分析系统（三）

【数据删除】大数据项目协力

大数据项目之深圳地铁大数据客流分析系统

OpenStack大数据项目Sahara模版

大数据项目架构思考

大数据项目开发参考

大数据项目（四）————用户画像

大数据项目阶段的策划

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)