Pythonの操作カフカ、生産者と消費者のコードデモ

技術のブログ: https://github.com/yongxinz/tech-blog

それと同時に、私はまた、公共のマイクロチャンネル数の注目歓迎AlwaysBeta、あなたを待つために、よりエキサイティングなコンテンツを。

使用Pythonの依存関係として:kafka-python 1.3.3

プロデューサー:

# -*- coding:utf-8 -*-

from kafka import KafkaProducer

# 此处ip可以是多个['0.0.0.1:9092','0.0.0.2:9092','0.0.0.3:9092' ]
producer = KafkaProducer(bootstrap_servers=['localhost:9092'])

for i in range(3):
    msg = "msg%d" % i
    producer.send('test', msg)

producer.close()

プロデューサー - 圧縮メッセージ

# -*- coding:utf-8 -*-

from kafka import KafkaProducer

# 此处ip可以是多个['0.0.0.1:9092','0.0.0.2:9092','0.0.0.3:9092' ]
producer = KafkaProducer(bootstrap_servers=['localhost:9092'], compression_type='gzip')

for i in range(3):
    msg = "msg%d" % i
    producer.send('test', msg)

producer.close()

メッセージが大きすぎる場合は、圧縮可能なメッセージング、オプションの値はgzipsnappylz4

データ-jsonプロデューサー

# -*- coding:utf-8 -*-

import json

from kafka import KafkaProducer

# 此处ip可以是多个['0.0.0.1:9092','0.0.0.2:9092','0.0.0.3:9092' ]
producer = KafkaProducer(bootstrap_servers=['localhost:9092'], value_serializer=lambda m: json.dumps(m).encode('ascii'))

for i in range(3):
    msg = "msg%d" % i
    producer.send('test', {msg: msg})

producer.close()

消費者:

# -*- coding:utf-8 -*-

from kafka import KafkaConsumer

consumer = KafkaConsumer('test', bootstrap_servers=['localhost:9092'])
for message in consumer:
    print ("%s:%d:%d: key=%s value=%s" % (message.topic, message.partition, message.offset, message.key, message.value))

消費者が最初に起動した後、プロデューサーを開始し、消費者はメッセージを消費することができ、通常のプログラムを見ることができます。

消費者-jsonデータ

# -*- coding:utf-8 -*-

import json

from kafka import KafkaConsumer

consumer = KafkaConsumer('test', bootstrap_servers=['localhost:9092'],
                         value_deserializer=lambda m: json.loads(m.decode('ascii')))
for message in consumer:
    print ("%s:%d:%d: key=%s value=%s" % (message.topic, message.partition, message.offset, message.key, message.value))

キーJSON形式は、生産と消費をサポートしている、唯一の指定する必要がありますkey_serializerkey_deserializer

消費者 - 最初のメッセージの読み取りを読みます

# -*- coding:utf-8 -*-

from kafka import KafkaConsumer

consumer = KafkaConsumer('test', bootstrap_servers=['localhost:9092'], auto_offset_reset='earliest')
for message in consumer:
    print ("%s:%d:%d: key=%s value=%s" % (message.topic, message.partition, message.offset, message.key, message.value))

最古のは、最初に使用可能なニュース、最新の最新ニュースへ移動します。

消費者は - 手動で設定したオフセット

# -*- coding:utf-8 -*-

from kafka import KafkaConsumer
from kafka.structs import TopicPartition

consumer = KafkaConsumer('test', bootstrap_servers=['localhost:9092'])

# 获取test主题的分区信息
print consumer.partitions_for_topic('test')
# 获取主题列表
print consumer.topics()
# 获取当前消费者订阅的主题
print consumer.subscription()
# 获取当前消费者topic、分区信息
print consumer.assignment()
# 获取当前主题的最新偏移量
print consumer.position(TopicPartition(topic='test', partition=0))
# 重置偏移量,从第1个偏移量消费
consumer.seek(TopicPartition(topic='test', partition=0), 1)
for message in consumer:
    print ("%s:%d:%d: key=%s value=%s" % (message.topic, message.partition, message.offset, message.key, message.value))

消費者 - 複数のトピックにサブスクライブ

# -*- coding:utf-8 -*-

from kafka import KafkaConsumer

consumer = KafkaConsumer(bootstrap_servers=['localhost:9092'])

# 订阅要消费的主题
consumer.subscribe(topics=['test', 'test0'])
for message in consumer:
    print ("%s:%d:%d: key=%s value=%s" % (message.topic, message.partition, message.offset, message.key, message.value))

消費者 - 手動プルメッセージ

# -*- coding:utf-8 -*-

import time

from kafka import KafkaConsumer

consumer = KafkaConsumer(bootstrap_servers=['localhost:9092'])

# 订阅要消费的主题
consumer.subscribe(topics=['test', 'test0'])
while True:
    msg = consumer.poll(timeout_ms=5)
    print msg
    time.sleep(1)

消費者 - ニュース中断と再開

# -*- coding:utf-8 -*-

import time

from kafka import KafkaConsumer
from kafka.structs import TopicPartition

consumer = KafkaConsumer(bootstrap_servers=['localhost:9092'])

# 订阅要消费的主题
consumer.subscribe(topics=['test'])
# 这句要有,否则报 KeyError: TopicPartition(topic='test', partition=0)
consumer.topics()
consumer.pause(TopicPartition(topic='test', partition=0))

num = 0
while True:
    print num
    # 获取当前挂起的消费者
    print consumer.paused()

    msg = consumer.poll(timeout_ms=5)
    print msg
    time.sleep(1)

    num = num + 1
    if num == 10:
        consumer.resume(TopicPartition(topic='test', partition=0))
        print "resume...... "

消費者グループ:

# -*- coding:utf-8 -*-

from kafka import KafkaConsumer

consumer = KafkaConsumer('test', group_id='my-group', bootstrap_servers=['localhost:9092'])
for message in consumer:
    print ("%s:%d:%d: key=%s value=%s" % (message.topic, message.partition, message.offset, message.key, message.value))

複数の消費者を起動し、消費者団体は、処理能力を向上させるために拡張することができます。

次のコマンドを実行し、プログラムを起動したら、消費者のグループのリストを見ることができます:

/usr/local/kafka/bin/kafka-consumer-groups.sh --bootstrap-server localhost:9092 --list
公開された47元の記事 ウォン称賛30 ビュー40000 +

おすすめ

転載: blog.csdn.net/zyx6a/article/details/104080764