我是GCP的新手,想知道如何调度包含3台GPU机器的GKE集群节点池。我发现这些机器的运营成本非常高,所以我正在寻找一种解决方案,可以每天晚上自动关闭所有这些机器/池,每天早上打开它们,因为这是一个开发项目。
发布于 2020-05-05 05:49:59
一种可能的解决方案是创建两个节点池:
-<default-node-pool> for kube-system pods
-<gpu-node-pool>只有一个节点池不起作用的原因是因为节点池不会缩小到0,不知何故kube-sytem pod需要存在于某个地方。
您可以使用node taint的概念来创建带有此标志的gpu节点池。
--节点污染cost=high:NoSchedule
然后,您可以对pod应用容差,如下所示
tolerations:
- key: cost
operator: Equal
value: high
effect: NoSchedule通过这种方式,您可以确保没有在GPU节点上调度kube-system pod。将会有一些kube-system pod在nodepool上运行,因为它们对任何东西都有容忍度。
打开自动定标器,如果是node is not needed,gpu节点池应该缩小到0,同时保持kube-system pod的默认节点池活动。
https://stackoverflow.com/questions/61601675
复制相似问题