在我的kubernetes集群(v1.14.7)中,在集群更新之后,有一个节点没有正确恢复。来自该节点的rook OSD没有被重新安排(正如它在文档中解释的那样),所以我尝试手动添加一个新的osd。
我的ceph status还这个
我的ceph osd tree还这个
我尝试使用ceph osd crush set osd.0 0.29199 root=default host=gke-dev-dev-110dd9ec-ntww将新的osd链接到节点。
但是它返回: Error ENOENT:无法在{host=gke 110dd9ec-ntww,root=default}:不存在的位置设置项id 0名称'osd.0‘权重0.29199。
你知道怎么解决这个问题吗?提前感谢
发布于 2020-01-23 19:28:53
下面是我的建议,与其尝试立即添加一个新的osd,不如修复/删除有缺陷的,它应该重新创建。
试试这个:
1-标出osd: osd.0
2-从挤压地图中移除: ceph挤压移除osd.0
3-删除上限: ceph del osd.0
4-移除osd: ceph rm osd.0
5-删除部署: kubectl删除-n您的集群-命名空间rook 0
6-编辑出您的osd id和基础设备的配置部分。
(C)暗含暗号
delete {"/var/lib/rook":x}7-删除rook-操作符荚,重新启动rook-操作符pod。
8-验证集群的健康状况: ceph -s;ceph tree
希望这能有所帮助!
发布于 2020-05-15 13:02:23
https://stackoverflow.com/questions/59883993
复制相似问题