首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何为运行在Prometheus上Kubernetes集群上的吊舱找到CPU/MEM的度量标准

如何为运行在Prometheus上Kubernetes集群上的吊舱找到CPU/MEM的度量标准
EN

Stack Overflow用户
提问于 2021-04-13 13:43:56
回答 1查看 1K关注 0票数 2

我有Prometheus设置通过Helm从Terraform,它是配置为连接到我的Kubernetes集群。我打开我的Prometheus,但是我不确定从列表中选择哪个度量来查看运行pods/作业的CPU/MEM。下面是使用该命令运行的所有豆荚(test1是kube 命名空间):

代码语言:javascript
复制
kubectl -n test1 get pods

吊舱运行

当我在Prometheus上时,我看到了许多与CPU相关的指标,但不确定该选择哪一个:

prom1

我尝试选择一个,但是名称空间= prometheus,它使用prometheus-node-exporter,我在这里没有看到我的集群或名称空间test1

prom2

你能帮帮我吗?先谢谢你。

更新屏幕截图更新屏幕快照--我需要集中讨论这个特定的名称空间,通常使用命令:kubectl get pods --all-namespaces | grep hermatwin --我看到了带有命名空间= jobs的第一行--我认为这是命名空间。

当将日历设置为上星期五时没有结果:

更新截图4月20日我试着选择2天,从上周六开始,4月17日,但我没有看到任何结果:

ANd,如果我删除(namespace=“作业”)条件,我也看不到任何结果:

刚才我试图再次重新运行作业(模拟作业),并试图在作业仍在运行模式下执行prometheus查询,但我没有得到任何结果:-(在这里,您可以看到我的作业在哪里运行。

我没有得到任何结果

使用简单过滤器时,只需使用container_cpu_usage_seconds_total,我就可以看到namespace=的“作业”。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-04-14 14:17:36

node_cpu_seconds_total是来自node-exporter的一个度量,它是一个提供机器统计信息的出口商,它的度量标准以node_为前缀。您需要来自cAdvisor的度量,这个度量生成与容器相关的度量,并且以container_作为前缀。

代码语言:javascript
复制
container_cpu_usage_seconds_total
container_cpu_load_average_10s
container_memory_usage_bytes
container_memory_rss

下面是一些基本的查询,供您开始使用。准备好它们可能需要调整(您可能有不同的标签名称):

每个Pod CPU利用率

代码语言:javascript
复制
sum(irate(container_cpu_usage_seconds_total{container!="POD", container=~".+"}[2m])) by (pod)

每只水袋的拉姆使用量

代码语言:javascript
复制
sum(container_memory_usage_bytes{container!="POD", container=~".+"}) by (pod)

每个Pod的进出交通率

请注意,使用host网络模式(而不是孤立的)的pods显示整个节点的通信速率。* 8是为了方便地将字节转换为位(MBit/s、GBit/s等)。

代码语言:javascript
复制
# incoming
sum(irate(container_network_receive_bytes_total[2m])) by (pod) * 8
# outgoing
sum(irate(container_network_transmit_bytes_total[2m])) by (pod) * 8
票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/67076100

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档