我是被Azure的推特支持(而不是在ServerFault.com上)要求在这里发布这篇文章的。
我们的Kubernetes环境已经工作了一个多星期而不需要改变,24个VHD都在Azure上使用容器服务。
然后,我们突然收到警报,所有的服务已经停止工作。所有使用持久性卷声明的荚都卡在ContainerCreating上。一个快速的kubectl describe pod podname显示:
Unable to mount volumes for pod "***-1370023040-st581_default(9b050936-1baa-11e7-9b77-000d3ab513dc)": timeout expired waiting for volumes to attach/mount for pod "default"/"***-1370023040-st581". list of unattached/unmounted volumes=[***-persistent-storage]和
Error syncing pod, skipping: timeout expired waiting for volumes to attach/mount for pod "default"/"***-1370023040-st581". list of unattached/unmounted volumes=[***-persistent-storage]在所有的吊舱上。
在Azure中,我可以看到,针对代理,只有作为磁盘附加的代理OS VHD。手动添加磁盘的尝试失败,原因如下:
Failed to update disks for the virtual machine 'k8s-agent-CD93CDEA-0'. Error: A disk named '***mgmt-dynamic-pvc-018bdc6e-161a-11e7-8ca8-000d3ab513dc.vhd' already uses the same VHD URL …https://***.blob.core.windows.net/vhds/***mgmt-dynamic-pvc-018bdc6e-161a-11e7-8ca8-000d3ab513dc.vhd ….重新启动代理/主程序也不能解决问题。
我们使用F16S作为代理,它支持32个数据磁盘。
如何重新连接VHD以重新开始工作?
发布于 2017-04-09 09:43:45
这一定是在Azure的系统中断,因为他们再次回来自己(几乎48小时的中断与它计费我们的资源!)
事实证明,你必须支付在Azure的支持,他们的系统中断。
Twitter支持团队创造了一张免费门票。他们的电话支持证实这是一个工程问题。
https://stackoverflow.com/questions/43283506
复制相似问题