我使用kops配置了kubernetes集群:
kops create cluster \
--zones ap-southeast-1a \
--dns-zone=${DNS_ZONE} \
--node-count 3 \
--vpc=${VPC_ID} \
--subnets=${SUBNET_ID} \
${NAME}Ec2实例已配置,我可以在控制台中看到它们。
DNS_ZONE是abc.in,这是route53中的公共托管区域
api.sp-southeast-1.es.k8s.abc.in. A 54.123.123.123
api.internal.sp-southeast-1.es.k8s.abc.in. A 172.123.123.123
etcd-a.internal.sp-southeast-1.es.k8s.abc.in. A 172.123.123.123
etcd-events-a.internal.sp-southeast-1.es.k8s.abc.in. A 172.123.123.123 我已经对同一问题进行了堆栈溢出的讨论。
我为master使用了3个t2.micro实例,为节点使用了3个t2.medium实例
主节点入站规则如下:
Custom TCP Rule TCP 4003 - 65535 sg-0559ecf7ab (nodes.sp-southeast-1.es.k8s.abc.in)
Custom TCP Rule TCP 2382 - 4000 sg-0559674a0d3ab (nodes.sp-southeast-1.es.k8s.abc.in)
All traffic All All sg-0ecc38031f44 (masters.sp-southeast-1.es.k8s.abc.in)
SSH TCP 22 0.0.0.0/0
Custom UDP Rule UDP 1 - 65535 sg-0557674a0d3ab (nodes.sp-southeast-1.es.k8s.abc.in)
Custom TCP Rule TCP 1 - 2379 sg-0557674a0d3ab (nodes.sp-southeast-1.es.k8s.abc.in)
Custom TCP Rule TCP 443 0.0.0.0/0当我进入的时候
kops validate cluster
> unexpected error during validation: error listing nodes:
Get https://api.sp-southeast-1.es.k8s.abc.in/api/v1/nodes:
dial tcp 54.123.123.123:443: i/o timeout发布于 2018-08-18 07:30:46
我已经升级了我的生产kube集群,我遇到了同样的问题。我们使用AWS云。
问题是由于集群api的dns配置(AWS Route 53)不正确,可能是kops中的bug?
为了解决这个问题,我手动为kube api设置了正确的ip地址,然后api就可以访问了。
更新:我发现问题是由于错误的kops升级,负责网络服务的kubelet没有正确运行。该集群使用1.10Kubernetes,但亚马逊网络服务ec2镜像版本为1.9。强制群集到1.9.8版本,群集升级运行正常,kubelet网络服务正确更新dns。
https://stackoverflow.com/questions/51457688
复制相似问题