首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >节点故障后的Rook OSD

节点故障后的Rook OSD
EN

Stack Overflow用户
提问于 2020-01-23 17:18:41
回答 2查看 2.9K关注 0票数 0

在我的kubernetes集群(v1.14.7)中,在集群更新之后,有一个节点没有正确恢复。来自该节点的rook OSD没有被重新安排(正如它在文档中解释的那样),所以我尝试手动添加一个新的osd。

我的ceph status还这个

这里

我的ceph osd tree还这个

这里

我尝试使用ceph osd crush set osd.0 0.29199 root=default host=gke-dev-dev-110dd9ec-ntww将新的osd链接到节点。

但是它返回: Error ENOENT:无法在{host=gke 110dd9ec-ntww,root=default}:不存在的位置设置项id 0名称'osd.0‘权重0.29199。

你知道怎么解决这个问题吗?提前感谢

EN

回答 2

Stack Overflow用户

发布于 2020-01-23 19:28:53

下面是我的建议,与其尝试立即添加一个新的osd,不如修复/删除有缺陷的,它应该重新创建。

试试这个:

1-标出osd: osd.0

2-从挤压地图中移除: ceph挤压移除osd.0

3-删除上限: ceph del osd.0

4-移除osd: ceph rm osd.0

5-删除部署: kubectl删除-n您的集群-命名空间rook 0

6-编辑出您的osd id和基础设备的配置部分。

(C)暗含暗号

代码语言:javascript
复制
       delete {"/var/lib/rook":x}

7-删除rook-操作符荚,重新启动rook-操作符pod。

8-验证集群的健康状况: ceph -s;ceph tree

希望这能有所帮助!

票数 1
EN

Stack Overflow用户

发布于 2020-05-15 13:02:23

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/59883993

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档