GKE集群配置有集群/节点自动配置。
我已经创建了一个默认的节点池,可以在该池上运行系统特定的吊舱。每当请求使用GPU的pods时,GKE都会自动创建新的启用GPU的节点池,这很好。
但是,每当我删除这类荚时,GKE都不会将新创建的节点池缩小到零实例。相反,有一个实例一直在运行。如果没有GPU请求,节点池应该达到最小大小,即零。
注意:
对于GPU驱动程序,
我编辑了这篇文章,并在豆荚中添加了标签'"cluster-autoscaler.kubernetes.io/safe-to-evict":"true“。
有人能帮助如何将新创建的节点池缩小到零节点吗?
更新:
在新节点上运行的荚是:
流利gcp(来自DaemonSet)
库贝代理
nvidia-gpu-设备-插件(来自DaemonSet)
这些吊舱不应该被赶出去吗?
发布于 2020-04-05 05:16:34
默认情况下,GKE为快速结荚调度保留了额外的节点资源。这是由自动缩放策略控制的默认行为。
可以通过将策略设置为“优化-利用”来更改此行为。
https://cloud.google.com/kubernetes-engine/docs/concepts/cluster-autoscaler
https://stackoverflow.com/questions/60931160
复制相似问题