KafkaConsumer方法解析

构造方法

KafkaConsumer(java.util.Map<java.lang.String,java.lang.Object> configs) ：通过提供一组键值对作为配置来实例化使用者。
KafkaConsumer(java.util.Map<java.lang.String,java.lang.Object> configs, Deserializer keyDeserializer, Deserializer valueDeserializer)
KafkaConsumer(java.util.Properties properties)：通过提供Properties对象作为配置来实例化使用者。
KafkaConsumer(java.util.Properties properties, Deserializer keyDeserializer, Deserializer valueDeserializer)

通过提供一组键值对作为配置来实例化使用者。有效的配置字符串在此处记录。值可以是字符串，也可以是适当类型的对象（例如，数字配置将接受字符串“ 42”或整数42）。
有效的配置字符串记录在ConsumerConfig中
keyDeserializer-实现解串器的密钥的解串器。直接将反序列化器传递给使用者时，不会在使用者中调用configure（）方法。
valueDeserializer - 用于实现反序列化的价值反序列化器。直接将反序列化器传递给使用者时，不会在使用者中调用configure（）方法。

参数详解参考：参数详解

主要方法

assign(java.util.Collection partitions) ：手动为该使用者分配分区列表。

手动为该使用者分配分区列表。此接口不允许增量分配，并且将替换先前的分配（如果有）。
如果给定的主题分区列表为空，则将其与unsubscribe（）相同。
通过这种方法手动分配主题不能使用使用者的组管理功能。这样，当组成员身份或群集和主题元数据发生更改时，将不会触发任何重新平衡操作。
请注意，不能同时将手动分区分配assign（Collection）与组分配与subscribe（Collection，ConsumerRebalanceListener）一起使用。
如果启用了自动提交，则会在新分配替换旧分配之前触发异步提交（基于旧分配）。
抛出异常：java.lang.IllegalArgumentException - 如果分区为空或包含空主题或空主题
java.lang.IllegalStateException - 如果先前使用主题或模式调用了subscribe（）（随后未调用unsubscribe（））

java.util.Set assignment() ：获取当前分配给该使用者的一组分区。

获取当前分配给该使用者的一组分区。如果订阅是通过使用Assign（Collection）直接分配分区而发生的，那么这将简单地返回已分配的相同分区。如果使用了主题订阅，那么这将给出当前分配给使用者的主题分区集（如果尚未进行分配，或者正在重新分配分区，则可能为none）。

java.util.Map<TopicPartition,java.lang.Long> beginningOffsets(java.util.Collection partitions) ：获取给定分区的第一个偏移量。

请注意，如果分区不存在，则此方法可能会无限期阻塞。
此方法不会更改分区的当前使用者位置。
返回值Map<TopicPartition,java.lang.Long>：给定分区的最早可用偏移量

close() ：关闭使用者，等待最多30秒的默认超时以进行任何所需的清理。

如果启用了自动提交，则将在默认超时范围内尽可能地提交当前偏移量。有关详细信息，请参见close（long，TimeUnit）。请注意，wakeup（）不能用于中断关闭。

close(long timeout, java.util.concurrent.TimeUnit timeUnit) ：尝试在指定的超时时间内彻底关闭使用者。

尝试在指定的超时时间内彻底关闭使用者。此方法等待超时，直到使用者完成挂起的提交并离开组。
如果启用了自动提交，则将在超时范围内提交当前偏移量。如果使用者无法完成偏移量提交并在超时到期之前正常退出组，则将使用者强制关闭。
请注意，wakeup（）不能用于中断关闭。

commitAsync()：提交所有主题和分区列表的最后一个poll（）返回的偏移量。

提交所有主题和分区列表的最后一个poll（）返回的偏移量。与commitAsync（null）相同

commitAsync(java.util.Map<TopicPartition,OffsetAndMetadata> offsets, OffsetCommitCallback callback) ：将指定的主题和分区列表的指定偏移量提交给Kafka。

同commitAsync(OffsetCommitCallback callback)

commitAsync(OffsetCommitCallback callback) ：提交最后一个poll（）返回的主题和分区订阅列表的偏移量

这是一个异步调用，不会阻塞。遇到的任何错误都将传递给回调（如果提供）或被丢弃。
通过多次调用此API提交的偏移量保证以与调用相同的顺序发送。相应的提交回调也以相同的顺序调用。
另外请注意，通过此API提交的偏移量可以保证在后续调用commitSync（）（和变体）返回之前完成。

commitSync()：提交的最后一个poll（）返回的所有主题和分区订阅列表的偏移量。

这只会向Kafka提交偏移量。使用此API提交的偏移量将在每次重新平衡后的首次获取时以及启动时使用
因此，如果您需要将偏移量存储在Kafka以外的任何其他位置，则不应使用此API。
这是一个同步提交，将阻塞直到提交成功或遇到不可恢复的错误（在这种情况下，它将被抛出给调用者）。
请注意，之前通过commitAsync（OffsetCommitCallback）（或类似方法）发送的异步偏移提交保证可以在完成此方法之前调用其回调。
抛出异常： CommitFailedException - 如果提交失败并且无法重试。仅当您将自动组管理与subscribe（Collection）一起使用时，或者如果存在具有相同groupId的活动组正在使用组管理，才可能发生这种情况。
WakeupException - 如果在调用此函数之前或同时调用了wakeup（）
InterruptException - 如果在调用此函数之前或期间中断了调用线程
AuthenticationException-如果身份验证失败。
AuthorizationException -
KafkaException -

commitSync(java.util.Map<TopicPartition,OffsetAndMetadata> offsets)：为指定的主题和分区列表提交指定的偏移量。

同上：这会将偏移量提交给Kafka。提交的偏移量应该是您的应用程序将使用的下一条消息，即lastProcessedMessageOffset +1。

OffsetAndMetadata committed(TopicPartition partition) ：获取给定分区的最后提交的偏移量（是否此提交是由该进程还是其他进程执行）。

获取给定分区的最后提交的偏移量（无论此提交是由该进程还是其他进程执行）。
如果发生故障，此偏移量将用作使用者的位置。
该调用将阻止进行远程调用，以从服务器获取最新的提交偏移量。
返回：最后提交的偏移量和元数据，如果没有先前的提交，则为null

java.util.Map<TopicPartition,java.lang.Long> endOffsets(java.util.Collection partitions) ：获取给定分区的最后一个偏移量。

分区的最后一个偏移量是即将到来的消息的偏移量，即最后一个可用消息的偏移量+ 1。
请注意，如果分区不存在，则此方法可能会无限期阻塞。此方法不会更改分区的当前使用者位置。
当Isolation.level = read_committed时，最后一个偏移将是最后一个稳定偏移（LSO）。这是第一个消息与未清事务的偏移量。随着事务完成，LSO向前发展。

java.util.Map<java.lang.String,java.util.List> listTopics() ：获取有关用户有权查看的所有主题的分区的元数据。

获取有关用户有权查看的所有主题的分区的元数据。此方法将向服务器发出远程调用。

java.util.Map<MetricName,? extends Metric> metrics() ：获取消费者保留的指标
java.util.Map<TopicPartition,OffsetAndTimestamp> offsetsForTimes(java.util.Map<TopicPartition,java.lang.Long> timestampsToSearch) : 通过时间戳查找给定分区的偏移量。

每个分区的返回偏移量是最早的偏移量，其时间戳大于或等于相应分区中的给定时间戳记。
这是一个阻塞调用。不必为使用者分配分区。
如果分区中的消息格式版本低于0.10.0，即消息没有时间戳，则该分区将返回null。
请注意，如果分区不存在，则此方法可能会无限期阻塞。
Parameters: timestampsToSearch - 从分区到时间戳的映射进行查找。
返回值：从分区到时间戳的映射，以及时间戳大于或等于目标时间戳的第一条消息的偏移量。如果没有这样的消息，将为该分区返回null。

java.util.List partitionsFor(java.lang.String topic) : 获取有关给定主题的分区的元数据。

获取有关给定主题的分区的元数据。如果该方法还没有有关给定主题的任何元数据，则此方法将向服务器发出远程调用。

pause(java.util.Collection partitions) : 暂停从请求的分区中提取。

将来对poll（long）的调用将不会从这些分区中返回任何记录，除非已使用resume（Collection）恢复了它们。
请注意，此方法不会影响分区订阅。特别是，使用自动分配时，它不会导致组重新平衡。

java.util.Set paused() : 获取先前通过调用pause（Collection）暂停的一组分区。

ConsumerRecords<K,V> poll(long timeout) :使用订阅/分配API之一获取指定主题或分区的数据。

使用订阅/分配API之一获取指定主题或分区的数据。在轮询数据之前未预订任何主题或分区是一个错误。
每次轮询时，消费者都将尝试使用上次消耗的偏移量作为起始偏移量，并依次获取。
可以通过seek（TopicPartition，long）手动设置最后消耗的偏移量，或者自动将其设置为已订阅分区列表的最后提交的偏移量
timeout参数：如果缓冲区中没有数据，则等待轮询所花费的时间（以毫秒为单位）。如果为0，则立即返回缓冲区中当前可用的任何记录，否则返回空。不能为负。
返回：ConsumerRecords<K,V>自上次获取主题和分区的已订阅列表以来的主题到记录的映射
抛出异常：InvalidOffsetException -如果一个分区或一组分区的偏移量未定义或超出范围，并且尚未配置偏移量重置策略
WakeupException - 如果在调用此函数之前或同时调用了wakeup（）
InterruptException - 如果在调用此函数之前或期间中断了调用线程
AuthenticationException - 如果身份验证失败。
AuthorizationException - 如果调用者缺乏对任何已订阅主题或已配置groupId的读取权限。
KafkaException - 其他任何不可恢复的错误（例如，无效的groupId或会话超时，反序列化键/值对的错误或将来版本中的任何新错误情况）
java.lang.IllegalArgumentException -如果超时值为负
java.lang.IllegalStateException - 如果使用者未订阅任何主题或未手动分配任何分区以从中使用

long position(TopicPartition partition) : 获取将要提取的下一条记录的偏移量（如果存在具有该偏移量的记录）。

获取将要提取的下一条记录的偏移量（如果存在具有该偏移量的记录）。
抛异常的情况：java.lang.IllegalArgumentException - 如果提供的TopicPartition没有分配给此使用者
InvalidOffsetException - 如果当前没有为分区定义偏移量
WakeupException - if wakeup() is called before or while this function is called
InterruptException - if the calling thread is interrupted before or while this function is called
AuthenticationException - if authentication fails. See the exception for more details
AuthorizationException - if not authorized to the topic or to the configured groupId. See the exception for more details
KafkaException - for any other unrecoverable errors

resume(java.util.Collection partitions) : 恢复已使用pause（Collection）暂停的指定分区。

如果要提取新的poll（long）调用，将从这些分区返回记录。如果分区以前没有暂停过，则此方法为无操作。

seek(TopicPartition partition, long offset) : 覆盖使用者将在下一次轮询（超时）时使用的获取偏移量。

覆盖使用者将在下一次轮询（超时）时使用的获取偏移量。如果对同一分区多次调用此API，则最新的偏移量将用于下一个poll（）。
请注意，如果在使用过程中随意使用此API来重置获取偏移量，则可能会丢失数据
抛出：java.lang.IllegalArgumentException - 如果提供的TopicPartition没有分配给此使用者，或者提供的偏移量为负

seekToBeginning(java.util.Collection partitions) : 寻找每个给定分区的第一个偏移量。

寻找每个给定分区的第一个偏移量。
此函数延迟计算，仅在调用poll（long）或position（TopicPartition）时才寻求所有分区中的第一个偏移量。如果没有提供分区，为所有当前分配的分区寻找第一个偏移量。

seekToEnd(java.util.Collection partitions) :寻找每个给定分区的最后一个偏移量。

此函数延迟计算，仅在调用poll（long）或position（TopicPartition）时才在所有分区中寻求最终偏移量。
如果没有提供分区，为所有当前分配的分区寻找最终偏移量。

subscribe(java.util.Collection<java.lang.String> topics) : 订阅给定的主题列表以获取动态分配的分区。

订阅给定的主题列表以获取动态分配的分区。主题订阅不是增量订阅。此列表将替换当前的分配（如果有）。
无法将主题订阅与组管理结合在一起，并通过Assign（Collection）进行手动分区分配。如果给定的主题列表为空，则将其与unsubscribe（）相同。
这是使用noop侦听器的subscription（Collection，ConsumerRebalanceListener）的简写。如果您需要寻找特定偏移量的能力，则应首选使用subscription（Collection，ConsumerRebalanceListener），因为组重新平衡会导致分区偏移量被重置。如果要执行自己的偏移量管理，还应该提供自己的侦听器，因为侦听器使您有机会在重新平衡完成之前提交偏移量。

subscribe(java.util.Collection<java.lang.String> topics, ConsumerRebalanceListener listener) : 订阅给定的主题列表以获取动态分配的分区。

订阅给定的主题列表以获取动态分配的分区。主题订阅不是增量订阅。此列表将替换当前的分配（如果有）。请注意，不可能将主题订阅与组管理与通过Assign（Collection）进行手动分区分配相结合。如果给定的主题列表为空，则将其与unsubscribe（）相同。
作为组管理的一部分，使用方将跟踪属于特定组的使用方列表，并在以下事件之一触发时触发重新平衡操作：

任何已订阅主题列表的分区数更改

主题已创建或删除

消费者组的现有成员死亡
4.通过join API将新成员添加到现有使用者组
当触发这些事件中的任何一个时，将首先调用提供的侦听器以指示消费者的分配已被撤销，然后在接收到新的分配时再次调用。请注意，此侦听器将立即覆盖在先前的订阅中设置的所有侦听器。但是，可以确保通过此接口吊销/分配的分区来自此调用中预订的主题。有关更多详细信息，请参见ConsumerRebalanceListener。
抛出异常：java.lang.IllegalArgumentException - 如果topic为null或包含null或为空的元素，或者listener为null
java.lang.IllegalStateException - 如果使用模式先前调用了subscription（），或者先前调用了assign（没有随后的对unsubscribe（）的调用），或者至少未配置分区分配策略

subscribe(java.util.regex.Pattern pattern):订阅与指定模式匹配的所有主题以获取动态分配的分区。

订阅与指定模式匹配的所有主题以获取动态分配的分区。模式匹配将针对检查时存在的主题定期进行。
这是使用noop(空)侦听器的subscription（Pattern，ConsumerRebalanceListener）的简写。
如果您需要寻找特定偏移量的能力，则应首选使用subscription（Pattern，ConsumerRebalanceListener），因为组重新平衡会导致分区偏移量被重置。
如果要执行自己的偏移量管理，还应该提供自己的侦听器，因为侦听器使您有机会在重新平衡完成之前提交偏移量。

subscribe(java.util.regex.Pattern pattern, ConsumerRebalanceListener listener) :订阅与指定模式匹配的所有主题以获取动态分配的分区。

订阅与指定模式匹配的所有主题以获取动态分配的分区。模式匹配将针对检查时存在的主题定期进行。
作为组管理的一部分，使用方将跟踪属于特定组的使用方列表，并在以下事件之一触发时触发重新平衡操作：
1.任何已订阅主题列表的分区数更改 2.主题已创建或删除 3.消费者组的现有成员死亡 4.通过join API将新成员添加到现有使用者组

java.util.Set<java.lang.String> subscription() :获取当前订阅。

获取当前订阅。将返回与最近一次对subscription的调用相同的主题（Collection，ConsumerRebalanceListener），如果未进行此类调用，则返回一个空集。

unsubscribe() :取消订阅当前使用subscribe（Collection）或subscribe（Pattern）订阅的主题。

取消订阅当前使用subscribe（Collection）或subscribe（Pattern）订阅的主题。这还将清除所有直接通过assign（Collection）分配的分区。

wakeup() : 唤醒消费者。

此方法是线程安全的，特别用于中止长时间轮询。
在操作中阻塞的线程将引发WakeupException。如果没有线程阻塞可以抛出WakeupException的方法，则对该方法的下一次调用将引发它。

疑问：

consumer.poll(Long.MAX_VALUE); 会一直等待还是等到什么情况返回。
ConsumerRecords records（partition）方法的使用

ConsumerRecords<String, String> records = consumer.poll(Long.MAX_VALUE);
for (TopicPartition partition : records.partitions()) {
List<ConsumerRecord<String, String>> partitionRecords = records.records(partition);

public java.util.Map<TopicPartition,OffsetAndTimestamp> offsetsForTimes(java.util.Map<TopicPartition,java.lang.Long> timestampsToSearch)）用法

香槟910716

发布了27 篇原创文章 · 获赞 4 · 访问量 3177

私信关注

KafkaConsumer方法解析

构造方法

参数详解参考：参数详解

主要方法

疑问：

猜你喜欢