它将监控Kafka lag,因为有时消费者会卡住而不会引发错误。
我的想法是..。如果某个“消费者组,主题”的滞后在20m (20个样本)内持续上升,则应该发出警告,这意味着相邻样本在这段时间内要么上升,要么平稳上升。
有没有办法在promql中定义这个触发器?
元素示例:
kafka_consumergroup_lag{consumergroup="order-beta",endpoint="http",instance="172.20.58.226:9308",job="kafka-exporter",namespace="monitoring",partition="0",pod="kafka-exporter-885fbcb9f-g9ktq",service="kafka-exporter",topic="health.check"}发布于 2020-07-05 21:54:23
尝试使用offset modifier。例如,当kafka_consumergroup_lag的当前值超过20分钟前的值时,以下PromQL查询将返回非空结果:
kafka_consumergroup_lag > kafka_consumergroup_lag offset 20m请尝试在Prometheus警报中使用此查询。
https://stackoverflow.com/questions/62546882
复制相似问题