我有Prometheus设置通过Helm从Terraform,它是配置为连接到我的Kubernetes集群。我打开我的Prometheus,但是我不确定从列表中选择哪个度量来查看运行pods/作业的CPU/MEM。下面是使用该命令运行的所有豆荚(test1是kube 命名空间):
kubectl -n test1 get pods当我在Prometheus上时,我看到了许多与CPU相关的指标,但不确定该选择哪一个:
我尝试选择一个,但是名称空间= prometheus,它使用prometheus-node-exporter,我在这里没有看到我的集群或名称空间test1。
你能帮帮我吗?先谢谢你。
更新屏幕截图更新屏幕快照--我需要集中讨论这个特定的名称空间,通常使用命令:kubectl get pods --all-namespaces | grep hermatwin --我看到了带有命名空间= jobs的第一行--我认为这是命名空间。

当将日历设置为上星期五时没有结果:

更新截图4月20日我试着选择2天,从上周六开始,4月17日,但我没有看到任何结果:

ANd,如果我删除(namespace=“作业”)条件,我也看不到任何结果:

刚才我试图再次重新运行作业(模拟作业),并试图在作业仍在运行模式下执行prometheus查询,但我没有得到任何结果:-(在这里,您可以看到我的作业在哪里运行。

我没有得到任何结果

使用简单过滤器时,只需使用container_cpu_usage_seconds_total,我就可以看到namespace=的“作业”。



发布于 2021-04-14 14:17:36
node_cpu_seconds_total是来自node-exporter的一个度量,它是一个提供机器统计信息的出口商,它的度量标准以node_为前缀。您需要来自cAdvisor的度量,这个度量生成与容器相关的度量,并且以container_作为前缀。
container_cpu_usage_seconds_total
container_cpu_load_average_10s
container_memory_usage_bytes
container_memory_rss下面是一些基本的查询,供您开始使用。准备好它们可能需要调整(您可能有不同的标签名称):
每个Pod CPU利用率
sum(irate(container_cpu_usage_seconds_total{container!="POD", container=~".+"}[2m])) by (pod)每只水袋的拉姆使用量
sum(container_memory_usage_bytes{container!="POD", container=~".+"}) by (pod)每个Pod的进出交通率
请注意,使用host网络模式(而不是孤立的)的pods显示整个节点的通信速率。* 8是为了方便地将字节转换为位(MBit/s、GBit/s等)。
# incoming
sum(irate(container_network_receive_bytes_total[2m])) by (pod) * 8
# outgoing
sum(irate(container_network_transmit_bytes_total[2m])) by (pod) * 8https://stackoverflow.com/questions/67076100
复制相似问题