我们有一个度量假设
(x_metrics{host="1.1.1.1",somelabel="c"})
x_metrics{host="1.1.2.1",somelabel="d"}
x_metrics{host="1.1.2.2",somelabel="e"}所有这些都是x_metrics的数据。但是现在出现了一个场景,比如x_metrics{host="1.1.2.1",somelabel="d"},这台特定的主机停止进入prometheus.And,我需要在通用条件下为所有主机写一个警报,如果停止,那么普罗米修斯是否应该触发alert.What,我将在这种情况下怎么办?
有没有人能在这个用例中给我指点一下?
发布于 2018-02-12 17:29:55
这里可以使用的是up指标,如果抓取主机失败,该指标将为0。要警告,您可以使用expression up == 0。
https://stackoverflow.com/questions/48740114
复制相似问题