请建议如何在模板或警报规则中说明哪些节点或服务是Prometheus。我在文档中找不到有关变量的信息。例如,我有后端、MongoDB、硬件、容器(码头)的警报规则,普罗米修斯如何区分这些警报规则在哪里以及如何应用这些规则?
发布于 2021-07-27 01:52:06
我想这只是一个如何配置规则和标签(prometheus_rules.yml)的问题。观察指标中有哪些信息,并将标签用于其他信息或过滤。考虑流行的指标up。下面是如何创建一个考虑了一些标签的规则。您可以使用来自特定导出器(例如up{job="node"} )的预定义标签,也可以像下面的示例(service, severity)那样分配新标签。
- alert: InstanceDown
expr: up{job="node"} == 0
for: 5m
labels:
severity: error
service: cluster
annotations:
summary: "Instance {{ $labels.instance }} down"
description: "{{ $labels.instance }} of job {{ $labels.job }} has been down for more than 5 minutes."https://stackoverflow.com/questions/68509118
复制相似问题