kafka(学习整理)

一、什么是吞吐量

吞吐量是指对网络、设备、端口、虚电路或其他设施,单位时间内成功地传送数据的数量


二、什么是kafka:

百度百科:kafka是一种高吞吐量的分布式发布订阅消息系统,可以处理消费者规模的网站中的所有动作流数据。

简单大白话理解:举个例子,生产者生产鸡蛋,消费者消费鸡蛋,生产者生产一个鸡蛋,消费者就消费一个鸡蛋



几种情况分析:

1、消费者消费鸡蛋的时候噎住了(系统宕机了),生产者还在生产鸡蛋,那新生产的鸡蛋就丢失了。

2、生产者很强劲(大交易量的情况),生产者1秒钟生产100个鸡蛋,消费者1秒钟只能吃50个鸡蛋,那要不了一会,消费者就吃不消了(消息堵塞,最   终导致系统超时),消费者拒绝再吃了,”鸡蛋“又丢失了


解决办法:

这个时候我们放个篮子在它们中间,生产出来的鸡蛋都放到篮子里,消费者去篮子里拿鸡蛋,这样鸡蛋就不会丢失了,都在篮子里,而这个篮子就是”kafka“。各位现在知道kafka是干什么的了吧,它就是那个"篮子"。 

补充说明:

鸡蛋其实就是“数据流”,系统之间的交互都是通过“数据流”来传输的(就是tcp、http什么的),也称为报文,也叫“消息”。消息队列满了,其实就是篮子满了,”鸡蛋“ 放不下了,那赶紧多放几个篮子,其实就是kafka的扩容。 


三、kafka基础名词:

     后面大家会看到一些关于kafka的名词,比如topic、producer、consumer、broker,我这边来简单说明一下。

  • producer生产者,就是它来生产“鸡蛋”的。
  • consumer:消费者,生出的“鸡蛋”它来消费。
  • topic:你把它理解为标签,生产者每生产出来一个鸡蛋就贴上一个标签(topic),消费者可不是谁生产                     的“鸡蛋”都吃的,这样不同的生产者生产出来的“鸡蛋”,消费者就可以选择性的“吃”了。
  • broker:就是篮子了。 



四、kafka常用命令:                    

创建kafka topic

bin/kafka-topics.sh --zookeeper localhost:8080 --create --topic test --replication-fctor 1 --partition 

查看topic所有列表

bin/kafka-topics.sh --zookeeper localhost:8080 --list

查看指定topic信息

bin/kafka-topics.sh --zookeeper localhost:8080 --describe --topic test

控制台向topic生产数据

bin/kafka-console-produce --broker-list localhost:8080 --topic test

控制台消费topic数据

bin/kafka-console-consume --zookeeper localhost:8080 --topic test --from-beginning

创建一个kafka topic

bin/kafka-topics.sh --zookeeper localhost:8080 --create --topic test --replication-factor 1 --partitions 1

注: partitions指定topic分区数,replication-factor指定topic每个分区的副本数

  • partitions分区数:
    • partitions :分区数,控制topic将分片成多少个log。可以显示指定,如果不指定则会使用broker(server.properties)中的num.partitions配置的数量
    • 虽然增加分区数可以提供kafka集群的吞吐量、但是过多的分区数或者或是单台服务器上的分区数过多,会增加不可用及延迟的风险。因为多的分区数,意味着需要打开更多的文件句柄、增加点到点的延时、增加客户端的内存消耗。
    • 分区数也限制了consumer的并行度,即限制了并行consumer消息的线程数不能大于分区数
    • 分区数也限制了producer发送消息是指定的分区。如创建topic时分区设置为1,producer发送消息时通过自定义的分区方法指定分区为2或以上的数都会出错的;这种情况可以通过alter –partitions 来增加分区数。
  • replication-factor副本
    • replication factor 控制消息保存在几个broker(服务器)上,一般情况下等于broker的个数。
    • 如果没有在创建时显示指定或通过API向一个不存在的topic生产消息时会使用broker(server.properties)中的default.replication.factor配置的数量


猜你喜欢

转载自blog.csdn.net/weixin_38118016/article/details/79468442
今日推荐