我们正在为我们的一个应用程序使用k8s集群,集群归其他团队所有,我们对那里的…没有完全控制权我们正在尝试找出关于资源利用率(CPU和内存)的指标,关于运行容器/pod/节点等的详细信息。需要找出有多少并行容器正在运行。问题是他们通过Prometheus暴露了对集群的监控,但使用Prometheus我们无法获得实时数据,它没有关于运行容器的信息。
我的问题是,在k8s集群中默认可用并能提供我们所需的所有东西的API是什么。我们不想从普罗米修斯或其他任何客户端读取数据,我们希望直接从集群读取指标,这样数据就不会过时。有什么建议吗?
发布于 2019-06-06 23:53:47
正如您提到的,您将需要metrics-server (或heapster)来获取这些信息。您可以确认指标服务器是否正在运行kubectl top nodes/pods,或者只需检查kube-system名称空间中是否存在堆栈或指标服务器pod。
此外,所提供的命令将能够显示您正在查找的信息。我不会深入讨论细节,因为here可以找到许多查看集群资源使用情况的线索和方法。您可能也应该看看cadvisor,它应该已经存在于集群中。It exposes a web UI which exports live information about all the containers on the machine。
除此之外,可能还有商业方法来获得您正在寻找的东西,例如SignalFx和其他类似的项目-但这可能需要集群管理员的参与。
https://stackoverflow.com/questions/56412752
复制相似问题