如何使用terraform禁用GKE集群节点维护自动修复?似乎我无法从GCP控制台停止节点或更改GKE节点的设置。所以我猜我将不得不尝试使用terraform,即使它重新创建了集群。
维护是如何进行的?我认为它会将所有pod迁移到辅助节点,然后重新启动第一个节点,对吗?但是,如果辅助节点没有足够的可用资源来处理主节点的所有节点,该怎么办?GCP会创建新节点吗?例如:主节点大约有110个pod,辅助节点有110个pod。如果节点需要重启,如何进行维护?
发布于 2021-02-15 18:50:04
您可以通过在GCP shell中运行以下命令来禁用节点自动修复:
gcloud container node-pools update <pool-name> --cluster <cluster-name> \
--zone compute-zone \
--no-enable-autorepair您还将了解如何使用此link中的GCP控制台执行此操作。
如果您仍然面临问题,并且希望禁用使用terraform的节点自动修复,那么如果您希望启用auto-repair,则必须在参数management中指定。您可以在terraform's文档中找到更多详细信息。
您还可以在此处了解node repair process的工作原理:
如果GKE检测到一个节点需要修复,该节点将被排出并重新创建。GKE等待一个小时,直到排泄完成。如果排出未完成,则关闭该节点并创建一个新节点。
如果多个节点需要修复,GKE可能会并行修复节点。GKE根据集群的大小和损坏节点的数量来平衡修复次数。GKE将在更大的集群上并行修复更多的节点,但随着不健康节点数量的增加,修复的节点会更少。
如果在修复过程中随时禁用节点自动修复,则当前正在修复的任何节点都不会取消正在进行的修复并继续进行修复。
https://stackoverflow.com/questions/66181924
复制相似问题