技術のブログ: https://github.com/yongxinz/tech-blog
それと同時に、私はまた、公共のマイクロチャンネル数の注目歓迎AlwaysBeta、あなたを待つために、よりエキサイティングなコンテンツを。
使用Pythonの依存関係として:kafka-python 1.3.3
プロデューサー:
# -*- coding:utf-8 -*-
from kafka import KafkaProducer
# 此处ip可以是多个['0.0.0.1:9092','0.0.0.2:9092','0.0.0.3:9092' ]
producer = KafkaProducer(bootstrap_servers=['localhost:9092'])
for i in range(3):
msg = "msg%d" % i
producer.send('test', msg)
producer.close()
プロデューサー - 圧縮メッセージ
# -*- coding:utf-8 -*-
from kafka import KafkaProducer
# 此处ip可以是多个['0.0.0.1:9092','0.0.0.2:9092','0.0.0.3:9092' ]
producer = KafkaProducer(bootstrap_servers=['localhost:9092'], compression_type='gzip')
for i in range(3):
msg = "msg%d" % i
producer.send('test', msg)
producer.close()
メッセージが大きすぎる場合は、圧縮可能なメッセージング、オプションの値はgzip
、snappy
、lz4
。
データ-jsonプロデューサー
# -*- coding:utf-8 -*-
import json
from kafka import KafkaProducer
# 此处ip可以是多个['0.0.0.1:9092','0.0.0.2:9092','0.0.0.3:9092' ]
producer = KafkaProducer(bootstrap_servers=['localhost:9092'], value_serializer=lambda m: json.dumps(m).encode('ascii'))
for i in range(3):
msg = "msg%d" % i
producer.send('test', {msg: msg})
producer.close()
消費者:
# -*- coding:utf-8 -*-
from kafka import KafkaConsumer
consumer = KafkaConsumer('test', bootstrap_servers=['localhost:9092'])
for message in consumer:
print ("%s:%d:%d: key=%s value=%s" % (message.topic, message.partition, message.offset, message.key, message.value))
消費者が最初に起動した後、プロデューサーを開始し、消費者はメッセージを消費することができ、通常のプログラムを見ることができます。
消費者-jsonデータ
# -*- coding:utf-8 -*-
import json
from kafka import KafkaConsumer
consumer = KafkaConsumer('test', bootstrap_servers=['localhost:9092'],
value_deserializer=lambda m: json.loads(m.decode('ascii')))
for message in consumer:
print ("%s:%d:%d: key=%s value=%s" % (message.topic, message.partition, message.offset, message.key, message.value))
キーJSON形式は、生産と消費をサポートしている、唯一の指定する必要がありますkey_serializer
とkey_deserializer
。
消費者 - 最初のメッセージの読み取りを読みます
# -*- coding:utf-8 -*-
from kafka import KafkaConsumer
consumer = KafkaConsumer('test', bootstrap_servers=['localhost:9092'], auto_offset_reset='earliest')
for message in consumer:
print ("%s:%d:%d: key=%s value=%s" % (message.topic, message.partition, message.offset, message.key, message.value))
最古のは、最初に使用可能なニュース、最新の最新ニュースへ移動します。
消費者は - 手動で設定したオフセット
# -*- coding:utf-8 -*-
from kafka import KafkaConsumer
from kafka.structs import TopicPartition
consumer = KafkaConsumer('test', bootstrap_servers=['localhost:9092'])
# 获取test主题的分区信息
print consumer.partitions_for_topic('test')
# 获取主题列表
print consumer.topics()
# 获取当前消费者订阅的主题
print consumer.subscription()
# 获取当前消费者topic、分区信息
print consumer.assignment()
# 获取当前主题的最新偏移量
print consumer.position(TopicPartition(topic='test', partition=0))
# 重置偏移量,从第1个偏移量消费
consumer.seek(TopicPartition(topic='test', partition=0), 1)
for message in consumer:
print ("%s:%d:%d: key=%s value=%s" % (message.topic, message.partition, message.offset, message.key, message.value))
消費者 - 複数のトピックにサブスクライブ
# -*- coding:utf-8 -*-
from kafka import KafkaConsumer
consumer = KafkaConsumer(bootstrap_servers=['localhost:9092'])
# 订阅要消费的主题
consumer.subscribe(topics=['test', 'test0'])
for message in consumer:
print ("%s:%d:%d: key=%s value=%s" % (message.topic, message.partition, message.offset, message.key, message.value))
消費者 - 手動プルメッセージ
# -*- coding:utf-8 -*-
import time
from kafka import KafkaConsumer
consumer = KafkaConsumer(bootstrap_servers=['localhost:9092'])
# 订阅要消费的主题
consumer.subscribe(topics=['test', 'test0'])
while True:
msg = consumer.poll(timeout_ms=5)
print msg
time.sleep(1)
消費者 - ニュース中断と再開
# -*- coding:utf-8 -*-
import time
from kafka import KafkaConsumer
from kafka.structs import TopicPartition
consumer = KafkaConsumer(bootstrap_servers=['localhost:9092'])
# 订阅要消费的主题
consumer.subscribe(topics=['test'])
# 这句要有,否则报 KeyError: TopicPartition(topic='test', partition=0)
consumer.topics()
consumer.pause(TopicPartition(topic='test', partition=0))
num = 0
while True:
print num
# 获取当前挂起的消费者
print consumer.paused()
msg = consumer.poll(timeout_ms=5)
print msg
time.sleep(1)
num = num + 1
if num == 10:
consumer.resume(TopicPartition(topic='test', partition=0))
print "resume...... "
消費者グループ:
# -*- coding:utf-8 -*-
from kafka import KafkaConsumer
consumer = KafkaConsumer('test', group_id='my-group', bootstrap_servers=['localhost:9092'])
for message in consumer:
print ("%s:%d:%d: key=%s value=%s" % (message.topic, message.partition, message.offset, message.key, message.value))
複数の消費者を起動し、消費者団体は、処理能力を向上させるために拡張することができます。
次のコマンドを実行し、プログラムを起動したら、消費者のグループのリストを見ることができます:
/usr/local/kafka/bin/kafka-consumer-groups.sh --bootstrap-server localhost:9092 --list