我们最近在我们的一个集群pod上遇到了一个问题,导致我们的应用程序宕机,并影响了我们的客户。
事情是这样的:我们能够从GCR中提取gke.gcr.io/istio/operator:1.6.3镜像,然而,它一夜之间就开始失败了。最后,我们注意到此镜像在公共istio-release registry, on gcr.io中不再可用,从而导致ImagePullBackoff失败。然而,我们仍然能够在docker.io上找到它。
话虽如此,我们仍然坚持从docker.io/istio/operator:1.6.3中提取图像的解决方案方法,目前这是一个非常简单的方法。然而,我们仍然持怀疑态度,并想知道为什么这张图片突然从gcr.io上消失了。
有没有人遇到过类似的情况?
诚挚的问候。
发布于 2020-07-28 17:46:08
我做了一些调查,但我找不到任何相关的东西。
正如我在评论中提到的,我强烈建议您将所有关键映像保存在私有容器注册表中。使用这种方法,您可以避免类似的事件,并获得对图像的一些额外控制,例如:versioning、安全等。
在互联网上有许多指南可以设置你自己的托管私有容器注册表,比如Nexus,如果你想作为服务使用,你可以尝试Gooogle Container Registry。
请记住,当您在关键环境中工作时,您需要尝试最小化变量,以使您的服务尽可能保持弹性。
发布于 2020-08-05 19:15:51
我注意到我们的一项服务部署到GKE时出现了一次小停机,并注意到istio-operator列出了一个红色警告。
日志是:
运算符回退拉取镜像“gke.gcr.io/istio/
:1.6.4”:ImagePullBackOff
由于istio-operator是GKE管理的一个工作负载,我很犹豫,但停机时间重复了几次,持续了几分钟,所以我还编辑了服务yaml并使用docker更新了图像。
https://stackoverflow.com/questions/63059314
复制相似问题