我们有多个安装了prometheues operator的k8s集群。一个特定的群集显示targetmissing/instance因某种原因而关闭
它们是如何设置的?库贝斯普雷
有多少个节点?9wrk/3 inf /3 mst
k8s版本- 1.15.9
你是怎么安装你的普罗米修斯的?舵(2)图>稳定/普罗米修斯-运算符
Prometheus TargetMissing / InstanceDown
但是,当我检查实际的端点时,一切看起来都很好。
root@k8s-prd-mst01 :~> k -n kube-system describe ep prometheus-prometheus-oper-kubelet
Name: prometheus-prometheus-oper-kubelet
Namespace: kube-system
Labels: k8s-app=kubelet
Annotations: <none>
Subsets:
Addresses: IPs-REDACTED
NotReadyAddresses: <none>
Ports:
Name Port Protocol
---- ---- --------
http-metrics 10255 TCP
cadvisor 4194 TCP
https-metrics 10250 TCP
Events: <none>
我已经重新安装了prometheues大约3次,没有运气,并且不能在任何其他集群上重现这个错误。我想知道我如何才能更深入地解决这个问题。我想我可以在豆荚中检查一些东西,但我不确定是什么?
我在另一个DC中有大约3个其他集群dev / sandbox和prod集群,它们没有以相同的方式安装这些警报,所以尝试找出问题的根源。任何帮助都是非常感谢的!
发布于 2020-11-25 21:05:17
我在这里看到了一个问题和一个建议。
问题:
你是怎么安装普罗米修斯的?舵(2)图>稳定/普罗米修斯-运算符
问题是这个图表是deprecated
的进一步开发已经转移到prometheus-community/helm-charts上。该图表已重命名为kube-prometheus-stack,以更清楚地反映它安装了
kube-prometheus项目堆栈,其中普罗米修斯操作员只是一个组件。
您应该改用链接的资源。请注意,kube-prometheus-stack有一些特定的先决条件:
这就引出了第二点:
Recommendation:
k8s版本- 1.15.9 helm (2)
这个版本的Kubernetes非常旧,因为最新的版本是v1.19。Helm版本也是如此。我强烈建议升级您的集群,并尽可能保持最新版本,以避免使用过时的解决方案。
https://stackoverflow.com/questions/64970240
复制相似问题