一文读懂:Kafka(分布式消息队列)的基础概念,教程 - 代码天地

一文读懂:Kafka(分布式消息队列)的基础概念,教程

其他 2020-02-13 18:24:16 阅读次数: 0

[提前声明]
文章由作者:张耀峰结合自己生产中的使用经验整理,最终形成简单易懂的文章
写作不易,转载请注明,谢谢!
代码案例地址: ?https://github.com/Mydreamandreality/sparkResearch

一文读懂系列:Kafka基本概念

我们一般学习一个新的技能,都会经历如下这么一个阶段:
这是个什么玩意啊,它能做什么啊,怎么做啊,为什么它就能做啊,哦这样啊.好厉害啊~
我就按照这个顺序把kafka和spark,es给你们讲明白咯

什么是kafka?

Kafka准确的说是分布式消息系统
要理解什么是分布式消息系统,我们要先了解它的应用场景何在

kafka的应用场景

可以这么说,我们生活在一个数据大爆炸的时代,各行各业的数据大量的增长,给我们的业务带来了很大的压力,但是同时,巨大的数据也给我们带来了巨大的隐形财富
那么这个时候我们就面临一个巨大的挑战
- 如何把巨大的业务数据接入到我们的大数据分析平台,
- 其次就是如何分析收集到的信息
欸,这个时候kafka就应运而生啦
kafka是专为分布式高吞吐量系统设计的
它的主要特性如下:
- 应用解耦,异步消息,流量削峰,高性能,高可用,高容错,内置分区等等
目前主流的分布式消息队列还有很多,比如:
- ActiveMQ
- RabbitMQ
- ZeroMQ
- 等等
- [目前各方面综合性能最好的理论上讲是RabbitMQ]
如上不同的分布式消息队列各自的适用场景都不同,它们之间详细的比较可以查看其它博主的文章

我在这里举一个kafka的生产应用场景
- 日志处理 [逻辑如下图]
- 首先我们有一个日志采集客户端,负责采集我们服务器的日志,每天定时的写入kafka队列中
- kafka则负责日志数据的接受,存储,转发
- 我们的大数据分析平台负责订阅并且消费kafka队列中的日志数据

分布式消息系统

那么我们知道kafka的应用场景后,就很好理解分布式消息系统了

分布式消息系统就是把数据从一个应用传递到另一个应用中,这样我们的程序就可以专注于数据,而不用额外的关注数据是如何共享的
我们的消息[也就是数据]在应用程序和消息系统之间是异步队列

消息模式

在kafka中,我们有两种类型的消费模式
- 一:点对点模式
- 二:发布:订阅[PUB-SUB]模式

点对点模式

消息生产者把消息存到队列中,然后消费者从队列中消息消息,
但是此处要注意的是:
- 消息被消费后,队列中就不再存储这条被消费的消息
点对点支持存在多个消费者,但是对一个消息而言,只会有一个消费者可以消费
举个简单的例子:比如在淘宝的订单系统中:
- 商家是消息生产者:它告诉消息队列还有多少个库存
- 我们就是消息消费者,我们去购买商家的商品
- 这个时候一个商家订单会对应到我们每个消费者
- 我们都可以消费这条消息,但是我消费完后你就无法再重复消费了

点对点如下图所示:
在这里插入图片描述

发布-订阅[pub-sub]

消息发布者把消息发布到主题[topic]中,同时可以有多个,订阅该主题的消费者进行消费,和点对点不同的是,发布订阅一个消息可以有多个消费者一起消费

发布-订阅如下图所示
在这里插入图片描述

kafka的优势

如下是几个kafka的优势,[当然还不止这些]
可靠性:Kafka是分布式,分区,复制和容错的
高可用:Kafka使用分布式提交日志,这意味着消息会尽可能快地保留在磁盘上,因此它是持久的
性能:Kafka对于发布和订阅消息都具有高吞吐量,就算我们是TB级别数据,它也保持稳定的性能,Kafka非常快,并保证零停机和零数据丢失

后续更新下kafka在java中的应用以及和spark大数据框架整合的代码案例

李时珍皮啊博客专家

发布了55 篇原创文章 · 获赞 329 · 访问量 7万+

私信关注

猜你喜欢

转载自blog.csdn.net/youbitch1/article/details/89470898

一文读懂:Kafka(分布式消息队列)的基础概念,教程

一文轻松读懂微服务、集群、分布式的概念和区别

一文读懂分布式锁

Kafka - 分布式消息队列

Kafka分布式消息队列

分布式消息队列Kafka

kafka——分布式的消息队列系统

Kafka——分布式的消息队列

5、分布式消息队列Kafka

分布式消息队列之kafka

一文读懂分布式事务一致性

一文读懂分布式唯一ID生成

一文读懂消息队列一些设计

干货！一文读懂分布式计算现状与未来

一文读懂分布式任务调度平台XXL-JOB

一文读懂分布式事务及其解决方案

一文读懂之flink分布式快照checkpoint

一文读懂 kafka

深夜更新 - 一文读懂MQ消息队列

分布式消息通讯-Kafka(一)

分布式消息队列kafka了解及选举方式讲解一（差延迟性队列）

消息队列一文读懂消息队列一些设计

分布式消息队列Kafka的集群部署

【线上直播】分布式消息队列Kafka

Kafka-分布式消息队列实战

分布式消息队列Kafka集群安装

kafka分布式消息队列介绍以及集群安装

基于Docker搭建分布式消息队列Kafka

Kafka 和 ZooKeeper 的分布式消息队列

docker：zookeeper与kafka实现分布式消息队列

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

更多

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)