我使用prometheus操作符在kubernetes上部署监控堆栈。我想知道是否有一种方法可以知道配置重载程序部署的配置是否失败。这对于使用配置重新加载程序容器重新加载其配置的prometheus和警报管理器资源是有效的。当配置失败时。我们在容器中有一个日志,但是基于失败的配置重新加载,我们可以有一个通知或警报吗?
发布于 2019-04-10 04:53:20
普罗米修斯暴露了一个你可以抓取的/metric端点。具体地说,有一个指标指示上次重新加载是否成功:
# HELP prometheus_config_last_reload_successful Whether the last configuration reload attempt was successful.
# TYPE prometheus_config_last_reload_successful gauge
prometheus_config_last_reload_successful 0您可以使用它在重新加载失败时发出警报。
groups:
- name: PrometheusAlerts
rules:
- alert: FailedReload
expr: prometheus_config_last_reload_successful == 0
for: 5m
labels:
severity: warning
annotations:
description: Reloading Prometheus' configuration has failed for {{$labels.namespace}}/{{ $labels.pod}}.
summary: Prometheus configuration reload has failedhttps://stackoverflow.com/questions/55600206
复制相似问题