kafka面试知识点整理

其他 2020-08-05 10:23:11 阅读次数: 0

一、部署

1.1、安装部署

二、概念及理论

Kafka是分布式发布-订阅消息系统。它最初由LinkedIn公司开发，之后成为Apache项目的一部分。Kafka是一个分布式的，可划分的，冗余备份的持久性的日志服务。它主要用于处理活跃的流式数据。

在大数据系统中，常常会碰到一个问题，整个大数据是由各个子系统组成，数据需要在各个子系统中高性能，低延迟的不停流转。传统的企业消息系统并不是非常适合大规模的数据处理。为了能在同时搞定在线应用（消息）和离线应用（数据文件，日志）Kafka就出现了。Kafka可以起到两个作用：

降低系统组网复杂度。
降低编程复杂度，各个子系统不在是相互协商接口，各个子系统类似插口插在插座上，Kafka承担高速数据总线的作用。

Kafka主要特点：

同时为发布和订阅提供高吞吐量。据了解，Kafka每秒可以生产约25万消息（50 MB），每秒处理55万消息（110 MB）。
可进行持久化操作。将消息持久化到磁盘，因此可用于批量消费，例如ETL，以及实时应用程序。通过将数据持久化到硬盘以及replication防止数据丢失。
分布式系统，易于向外扩展。所有的producer、broker和consumer都会有多个，均为分布式的。无需停机即可扩展机器。
消息被处理的状态是在consumer端维护，而不是由server端维护。当失败时能自动平衡。支持online和offline的场景。

2.0、Kafka的架构原理

2.1、Producer&Consumer

2.2、Topics and Logs

2.3、kafka文件存储

三、整合

3.1、kafka+flume

3.2、flume+kafka+storm

3.3、kafka 出现错误问题

3.3.1、kafka消费少了

Reference

猜你喜欢

转载自blog.csdn.net/wuxintdrh/article/details/105952112

kafka面试知识点整理

kafka知识点整理

kafka 知识点整理

面试知识点整理

kafka学习笔记：知识点整理

Java 面试通关知识点整理！

JVM面试知识点整理

面试，笔试知识点整理

PHP 面试知识点整理归纳

Java 核心面试知识点整理！

20200103面试知识点整理

[Big Data - Kafka] kafka学习笔记：知识点整理

知识点整理

高级 Java 面试通关知识点整理！

数据库面试知识点整理

Vue 面试中常问知识点整理

Java面试题以及知识点整理（1）

搞定PHP面试 - 变量知识点整理

搞定PHP面试 - 运算符知识点整理

java面试知识点整理之扩展系列

java面试知识点整理之web系列

java面试知识点整理之java基础

C++面试题&知识点整理

面试视频知识点整理1-3

数据库知识点整理（秋招面试）

web前端面试知识点整理

知识点整理，MyBatis面试题

知识点整理，Redis面试题

知识点整理，Elasticsearch面试题

知识点整理，ZooKeeper面试题

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)