我正在使用普罗米修斯的Pushgateway,一切正常,但几周后Pushgateway崩溃了……看一看,有很多指标都不再使用了,手动删除它们几乎是不可能的……所以->
有一种方法可以使用TTL或其他保留设置(如按大小或按时间?)使推送网关指标过期。或者两者兼而有之?
注意:我在普罗米修斯的邮件列表中读到了很多人在一年或更长时间前需要这样的东西……到目前为止,唯一的答案是->,这不是Promethean的方法。真的吗?...通常,如果这对很多人来说是一个真正的痛苦,也许应该有更好的方法(即使这不是Promethean的方法)
发布于 2020-08-24 22:53:02
假设您想要删除与组相关的指标,当它们变得太旧时(对于给定的太旧的定义),您拥有由推送网关自动定义的指标push_time_seconds。
push_time_seconds{instance="foo",job="bar",try="longtime"} 1.598280005888635e+09有了这些信息,您就可以编写一个脚本来请求/获取这个指标,并用这个值来识别旧的数据组({instance="foo",job="bar",try="longtime"})。API允许您删除与旧数据相关指标:
curl -X DELETE http://pushgateway:9091/metrics/job/bar/instance/foo/try/longtime这可以在几行bash脚本或python中完成。
发布于 2021-04-07 21:43:43
没有从普罗米修斯团队得到积极的回应。所以实现了同样的功能。
https://github.com/dinumathai/pushgateway
docker pull dmathai/prom-pushgateway-ttl:latest docker run -d -p 9091:9091 dmathai/prom-pushgateway-ttl:latest --metric.timetolive=60s
https://stackoverflow.com/questions/63540280
复制相似问题