我正在开发一个产品,它可以根据用户使用产品的方式添加/删除用户组。
在我们的产品中,enable.auto.commit被关闭了,取而代之的是,我们每次收到数据后都会提交偏移量。
我们最近实现了一个暂停/恢复产品的服务。kafka库(在NodeJS中)还没有可用的暂停/恢复功能,所以我最终取消订阅/订阅了主题,而不是基于消费者消费者组,这似乎是我们想要的。
唯一的问题出现在添加新的消费者组时。首先,让我解释一下我看到的行为:
这是消费者"group1“信息..
$ bin/kafka-consumer-groups.sh --bootstrap-server localhost:9092 --describe --group philz-topic-group1
TOPIC PARTITION CURRENT-OFFSET LOG-END-OFFSET LAG CONSUMER-ID HOST CLIENT-ID
philz-topic 1 33 33 0 rdkafka-3ac4d56e-e94b-4365-9af7-04e485502b5d /10.233.113.109 rdkafka
philz-topic 4 34 34 0 rdkafka-d642805c-f5ea-4450-9cb0-3272fcbbffc9 /10.233.88.251 rdkafka
philz-topic 0 23 23 0 rdkafka-12cfca8b-fd61-4a68-bc5f-1946c8ef4eb1 /10.233.120.55 rdkafka
philz-topic 2 26 26 0 rdkafka-7561ca2a-9894-4a3d-83fe-d379bbe64fdf /10.233.126.40 rdkafka
philz-topic 3 20 20 0 rdkafka-cd9d5ed6-7daa-4b75-8f39-6704c8d887ed /10.233.119.133 rdkafka这是消费者"group2“信息..刚刚添加了消费者"group2“,并完成了一个操作。因此,单个操作的当前偏移量和滞后已更新。
$ bin/kafka-consumer-groups.sh --bootstrap-server localhost:9092 --describe --group philz-topic-group2
TOPIC PARTITION CURRENT-OFFSET LOG-END-OFFSET LAG CONSUMER-ID HOST CLIENT-ID
philz-topic 3 - 20 - rdkafka-b56306e1-b4b7-43fe-a604-ab7c12f70e9f /10.233.119.133 rdkafka
philz-topic 1 - 33 - rdkafka-76c9a4d2-268b-4ebb-94a8-f1230c9bbfea /10.233.113.109 rdkafka
philz-topic 4 34 34 0 rdkafka-d412e574-8241-48c6-af26-c50be44eb51d /10.233.126.40 rdkafka
philz-topic 0 - 23 - rdkafka-33179a7d-cb9f-453a-83c6-e7e4780372b6 /10.233.88.251 rdkafka
philz-topic 2 - 26 - rdkafka-77506e87-b666-4c92-82df-82071e2ff801 /10.233.120.55 rdkafka如果添加了新的消费者组,但未完成任何操作,则上述命令不会显示该消费者组的相关信息。
我目前面临的问题是,当暂停/恢复操作发生时,消费者组的所有分区都没有更新的当前偏移量和滞后,当取消订阅/暂停并完成操作时,分区现在的滞后应该是1。但是,如果新的使用者组之前没有任何给定分区的当前偏移量和滞后,则该信息现在将被跳过,并且永远不会被使用者组看到。
我的问题是,当创建一个新的消费者组时,我们是否可以更新该组的当前偏移量,以匹配所有可用分区的LOG-END-OFFSET?
我对Kafka不是很熟悉,所以任何关于行为的解释都是值得感谢的。
我的猜测是,由于我们自己提交了offset (因为enable.auto.commit被关闭),当操作发生时,我们能够看到新使用者组的一些信息,但只能看到一个分区(刚刚接收数据的分区)显示并使用当前偏移量更新。
谢谢!
编辑:
此外,在我的示例中,我的每个使用者组有5个使用者和5个分区,因此每个分区应该有一个使用者
发布于 2018-08-20 04:26:00
感谢cricket_007提供了执行此操作所需的kafka消费者选项
消费者选项auto.offset.reset允许在实例化时自动设置消费者偏移量。通过将此选项的值设置为“最早”,它会将每个分区的当前偏移量设置为LOG-END-OFFSET。
要使用节点库设置此选项,只需执行以下操作:
const consumer = new Kafka.KafkaConsumer(config, {
'auto.offset.reset': 'earliest'
});其中config是针对消费者的键/值对配置,第二个参数是用于创建默认主题配置的键/值对配置。
该配置是在使用者上设置的主题级别配置,如下所示:https://github.com/edenhill/librdkafka/blob/0.11.1.x/CONFIGURATION.md
https://stackoverflow.com/questions/51903403
复制相似问题