Kafka基础—2、Kafka 生产者API

Kafka知识库 - 索引目录

一、Kafka生产者API

1、发送消息

在 Go 语言中使用 Kafka 生产者 API,首先需要 Kafka 的 Go 客户端库。

常用的库包括 sarama 或 confluent-kafka-go。

sarama 是一个 Go 语言的 Kafka 客户端库,用于与 Kafka 集成,实现 Kafka 生产者和消费者的功能。

这里使用 sarama,我们来看一个简单的示例,步骤如下:

步骤一:安装 Sarama 库

go get github.com/Shopify/sarama

步骤二:编写生产者代码

package main

import (
	"fmt"
	"log"
	"os"
	"os/signal"

	"github.com/Shopify/sarama"
)

func main() {
    
    
	// 设置 Kafka broker 地址,创建配置
	config := sarama.NewConfig()
	config.Producer.RequiredAcks = sarama.WaitForAll
	config.Producer.Retry.Max = 5
	config.Producer.Return.Successes = true

	// 创建生产者
	producer, err := sarama.NewSyncProducer([]string{
    
    "kafka-broker1:9092", "kafka-broker2:9092"}, config)
	if err != nil {
    
    
		log.Fatalf("Error creating producer: %s", err.Error())
	}
	defer func() {
    
    
		if err := producer.Close(); err != nil {
    
    
			log.Fatalf("Error closing producer: %s", err.Error())
		}
	}()

	// 构造消息
	message := &sarama.ProducerMessage{
    
    
		Topic: "your_topic", // 设置消息发送到的主题
		Value: sarama.StringEncoder("Hello, Kafka!"), // 设置消息内容
	}

	// 发送消息
	partition, offset, err := producer.SendMessage(message)
	if err != nil {
    
    
		log.Fatalf("Failed to send message: %s", err.Error())
	}

	fmt.Printf("Message sent to partition %d at offset %d\n", partition, offset)

	// 处理退出信号
	sigchan := make(chan os.Signal, 1)
	signal.Notify(sigchan, os.Interrupt)
	<-sigchan
}

解释代码

  1. 引入 sarama 库,设置 Kafka 的连接配置。
  2. 创建生产者实例。
  3. 构造要发送到 Kafka 主题的消息。
  4. 使用生产者的 SendMessage 方法发送消息。
  5. 处理发送成功后的分区和偏移量。
  6. 设置信号处理,等待中断信号关闭程序。

2、消息压缩

当谈论 Kafka 生产者 API 中的消息压缩时,我们指的是将消息在发送到 Kafka 之前进行压缩,以减少网络传输的数据量,提高传输效率。

Kafka 提供了多种消息压缩算法,包括 GZIP、Snappy 和 LZ4。

步骤一:引入 Sarama 库

首先,确保已安装 Sarama 库,可以使用以下命令安装:

go get github.com/Shopify/sarama

步骤二:编写消息压缩代码

package main

import (
	"fmt"
	"log"
	"os"
	"os/signal"

	"github.com/Shopify/sarama"
)

func main() {
    
    
	// 设置 Kafka broker 地址,创建配置
	config := sarama.NewConfig()
	config.Producer.RequiredAcks = sarama.WaitForAll
	config.Producer.Retry.Max = 5
	config.Producer.Return.Successes = true
	config.Producer.Compression = sarama.CompressionGZIP // 设置消息压缩算法

	// 创建生产者
	producer, err := sarama.NewSyncProducer([]string{
    
    "kafka-broker1:9092", "kafka-broker2:9092"}, config)
	if err != nil {
    
    
		log.Fatalf("Error creating producer: %s", err.Error())
	}
	defer func() {
    
    
		if err := producer.Close(); err != nil {
    
    
			log.Fatalf("Error closing producer: %s", err.Error())
		}
	}()

	// 构造消息
	message := &sarama.ProducerMessage{
    
    
		Topic: "your_topic",                          // 设置消息发送到的主题
		Value: sarama.StringEncoder("Hello, Kafka!"), // 设置消息内容
	}

	// 发送消息
	partition, offset, err := producer.SendMessage(message)
	if err != nil {
    
    
		log.Fatalf("Failed to send message: %s", err.Error())
	}

	fmt.Printf("Message sent to partition %d at offset %d\n", partition, offset)

	// 处理退出信号
	sigchan := make(chan os.Signal, 1)
	signal.Notify(sigchan, os.Interrupt)
	<-sigchan
}

步骤三:解释代码

在这个示例中,我们在创建 Kafka 生产者时设置了消息压缩算法:

config.Producer.Compression = sarama.CompressionGZIP // 设置消息压缩算法

在这里,我们选择了 GZIP 压缩算法,也可以选择其他算法,比如 Snappy 或 LZ4。

一旦设置了压缩算法,生产者发送的消息将会在发送之前进行压缩,以减少网络传输的数据量。

Kafka 消费者在接收到消息后会自动解压缩,因此对于消费者来说,压缩是透明的。

3、生产者配置

步骤一:引入 Sarama 库

首先,确保已安装 Sarama 库,可以使用以下命令安装:

go get github.com/Shopify/sarama

步骤二:编写生产者配置代码

package main

import (
	"fmt"
	"log"
	"os"
	"os/signal"

	"github.com/Shopify/sarama"
)

func main() {
    
    
	// 创建配置
	config := sarama.NewConfig()

	// 设置生产者参数
	config.Producer.RequiredAcks = sarama.WaitForAll      // 设置等待所有副本确认消息
	config.Producer.Retry.Max = 5                          // 设置最大的重试次数
	config.Producer.Return.Successes = true                // 设置是否返回成功的消息
	config.Producer.Compression = sarama.CompressionGZIP   // 设置消息压缩算法
	config.Producer.Partitioner = sarama.NewRandomPartitioner // 设置分区策略为随机分区

	// 创建生产者
	producer, err := sarama.NewSyncProducer([]string{
    
    "kafka-broker1:9092", "kafka-broker2:9092"}, config)
	if err != nil {
    
    
		log.Fatalf("Error creating producer: %s", err.Error())
	}
	defer func() {
    
    
		if err := producer.Close(); err != nil {
    
    
			log.Fatalf("Error closing producer: %s", err.Error())
		}
	}()

	// 构造消息
	message := &sarama.ProducerMessage{
    
    
		Topic: "your_topic",                          // 设置消息发送到的主题
		Value: sarama.StringEncoder("Hello, Kafka!"), // 设置消息内容
	}

	// 发送消息
	partition, offset, err := producer.SendMessage(message)
	if err != nil {
    
    
		log.Fatalf("Failed to send message: %s", err.Error())
	}

	fmt.Printf("Message sent to partition %d at offset %d\n", partition, offset)

	// 处理退出信号
	sigchan := make(chan os.Signal, 1)
	signal.Notify(sigchan, os.Interrupt)
	<-sigchan
}

步骤三:解释代码

在这个示例中,我们创建了一个 sarama.Config 对象,然后设置了一些常见的生产者配置参数:

  1. config.Producer.RequiredAcks:设置等待所有副本确认消息,这意味着生产者会等待所有副本都成功写入消息后才会认为消息发送成功。

  2. config.Producer.Retry.Max:设置最大的重试次数,当消息发送失败时,生产者将尝试重新发送消息的最大次数。

  3. config.Producer.Return.Successes:设置是否返回成功的消息,如果设置为 true,生产者在消息发送成功时会返回一个 success 消息。

  4. config.Producer.Compression:设置消息压缩算法,这里选择了 GZIP,你可以根据需要选择其他算法。

  5. config.Producer.Partitioner:设置分区策略,这里选择了随机分区策略,即将消息发送到一个随机分区。

在这个示例中,我们使用的是同步生产者 (NewSyncProducer),也可以根据需要选择异步生产者 (NewAsyncProducer)。

4、分区器(Partitioner)

当我们谈论 Kafka 生产者 API 中的分区器(Partitioner)时,我们指的是决定消息被发送到哪个分区的机制。

分区器帮助生产者确定消息在 Kafka 主题的哪个分区上写入,这是一个关键的设计决策,因为它影响到消息的顺序性、负载均衡和并行性。

4.1 分区器的作用

Kafka 主题通常被分为多个分区,每个分区是一个有序的日志。消息被发送到特定的分区,这有助于保持消息的顺序性。分区器的任务是根据某种规则决定消息属于哪个分区。

4.2 示例与详细解释

package main

import (
	"fmt"
	"log"
	"os"
	"os/signal"

	"github.com/Shopify/sarama"
)

// CustomPartitioner 自定义分区器
type CustomPartitioner struct{
    
    }

// Partition 实现sarama.Partitioner接口
func (p *CustomPartitioner) Partition(message *sarama.ProducerMessage, numPartitions int32) (int32, error) {
    
    
	// 在这里,设置自定义的分区逻辑
	// 这里简单地使用消息的 key 的哈希值对分区数取余
	key := message.Key
	if key == nil {
    
    
		// 如果消息没有 key,使用默认分区(随机分区)
		return int32(sarama.NewRandomPartitioner.RandomPartition(message, numPartitions)), nil
	}
	return int32(sarama.NewHashPartitioner.Hash(key, numPartitions)), nil
}

func main() {
    
    
	// 创建配置
	config := sarama.NewConfig()

	// 设置自定义分区器
	config.Producer.Partitioner = &CustomPartitioner{
    
    }

	// 创建生产者
	producer, err := sarama.NewSyncProducer([]string{
    
    "kafka-broker1:9092", "kafka-broker2:9092"}, config)
	if err != nil {
    
    
		log.Fatalf("Error creating producer: %s", err.Error())
	}
	defer func() {
    
    
		if err := producer.Close(); err != nil {
    
    
			log.Fatalf("Error closing producer: %s", err.Error())
		}
	}()

	// 构造消息
	message := &sarama.ProducerMessage{
    
    
		Topic: "your_topic",                          // 设置消息发送到的主题
		Value: sarama.StringEncoder("Hello, Kafka!"), // 设置消息内容
		Key:   sarama.StringEncoder("some_key"),      // 设置消息的 key
	}

	// 发送消息
	partition, offset, err := producer.SendMessage(message)
	if err != nil {
    
    
		log.Fatalf("Failed to send message: %s", err.Error())
	}

	fmt.Printf("Message sent to partition %d at offset %d\n", partition, offset)

	// 处理退出信号
	sigchan := make(chan os.Signal, 1)
	signal.Notify(sigchan, os.Interrupt)
	<-sigchan
}

4.3 解释代码

在这个示例中,我们首先创建了一个自定义的分区器 CustomPartitioner,并实现了 sarama.Partitioner 接口的 Partition 方法。在 Partition 方法中,我们可以定义自己的分区逻辑。在这里,我们简单地使用消息的 key 的哈希值对分区数取余,如果消息没有 key,则使用默认的随机分区。

func (p *CustomPartitioner) Partition(message *sarama.ProducerMessage, numPartitions int32) (int32, error) {
    
    
	key := message.Key
	if key == nil {
    
    
		return int32(sarama.NewRandomPartitioner.RandomPartition(message, numPartitions)), nil
	}
	return int32(sarama.NewHashPartitioner.Hash(key, numPartitions)), nil
}

接着,我们将这个自定义分区器设置到生产者的配置中:

config.Producer.Partitioner = &CustomPartitioner{
    
    }

这样,在发送消息时,生产者将使用我们自定义的分区逻辑来确定消息应该被发送到哪个分区。

5、序列化(Serializer)

当我们谈论 Kafka 生产者 API 中的序列化(Serializer)时,我们指的是将消息转换为字节流的过程,以便能够在网络上传输。

在 Kafka 中,消息需要被序列化成字节流才能被生产者发送到 Kafka 集群。序列化器负责将消息对象转换为字节流,并在消费者端将字节流反序列化为原始消息对象。

这个过程是为了确保消息能够在网络中进行有效的传输和存储。

5.1 为什么需要序列化?

Kafka 是一个分布式的消息系统,消息需要在不同的节点之间传递。为了实现这个跨网络传输,消息必须以字节流的形式进行表示。序列化就是将消息对象转换为字节流的过程。

5.2 示例与详细解释

让我们以一个简单的示例来说明序列化的过程。

假设我们有一个消息结构体:

type MyMessage struct {
    
    
	ID   int
	Body string
}

首先,我们需要定义一个序列化器,将这个结构体转换为字节流:

package main

import (
	"bytes"
	"encoding/gob"
	"fmt"
	"log"
)

// MyMessage 结构体
type MyMessage struct {
    
    
	ID   int
	Body string
}

// Serializer 序列化器
type Serializer struct{
    
    }

// Serialize 将消息对象序列化为字节流
func (s *Serializer) Serialize(message *MyMessage) ([]byte, error) {
    
    
	var buffer bytes.Buffer
	encoder := gob.NewEncoder(&buffer)
	err := encoder.Encode(message)
	if err != nil {
    
    
		return nil, err
	}
	return buffer.Bytes(), nil
}

// Deserialize 将字节流反序列化为消息对象
func (s *Serializer) Deserialize(data []byte) (*MyMessage, error) {
    
    
	var message MyMessage
	decoder := gob.NewDecoder(bytes.NewReader(data))
	err := decoder.Decode(&message)
	if err != nil {
    
    
		return nil, err
	}
	return &message, nil
}

func main() {
    
    
	// 创建消息对象
	message := &MyMessage{
    
    
		ID:   1,
		Body: "Hello, Kafka!",
	}

	// 创建序列化器
	serializer := &Serializer{
    
    }

	// 序列化消息
	serializedData, err := serializer.Serialize(message)
	if err != nil {
    
    
		log.Fatalf("Error serializing message: %s", err.Error())
	}

	// 打印序列化后的字节流
	fmt.Printf("Serialized data: %v\n", serializedData)

	// 反序列化消息
	deserializedMessage, err := serializer.Deserialize(serializedData)
	if err != nil {
    
    
		log.Fatalf("Error deserializing message: %s", err.Error())
	}

	// 打印反序列化后的消息对象
	fmt.Printf("Deserialized message: %+v\n", deserializedMessage)
}

5.3 解释代码

在这个示例中,我们首先定义了一个简单的消息结构体 MyMessage,然后创建了一个序列化器 Serializer,它实现了 SerializeDeserialize 方法。Serialize 方法将消息对象转换为字节流,而 Deserialize 方法将字节流反序列化为消息对象。

我们使用 encoding/gob 包来进行序列化和反序列化。在实际应用中,你可能会选择其他序列化方式,如 JSON 或 Avro,取决于你的需求和系统的兼容性。

最后,我们创建了一个消息对象,使用序列化器将其序列化为字节流,并打印结果。然后,我们再将字节流反序列化为消息对象,并打印结果。这展示了序列化在实际应用中的基本用法。

猜你喜欢

转载自blog.csdn.net/weixin_49015143/article/details/135061197