看看你能不能帮我。
我们有一个旧的BeeGFS安装,在EL7上运行7.1.5版本,其中一个TargetID脱机了(不替换)。它回来后,巴迪镜像进入了一个失败的状态,我们无法恢复。
如果我们试图将Target更改为online,它将失败:
[root@headnode beegfs]# beegfs-ctl --nodetype=storage --setstate --state=good --force --targetid=13节点不接受状态更改。错误:未知存储目标
国家的表现如下:
root@headnode ~]# beegfs-ctl --listtargets --nodetype=storage --stateTargetID可达性一致性NodeID ======== =============================1网上好1 2在线好2 3在线好3 4在线好4在线好5 6在线好6 7在线好7 8在线好8 9在线好9 10在线好10 11在线好11 12在线好12 13离线好13 14在线好14 16请注意,一个编号为16的新TargetID出现在应该是13的地方。我试着把它换回13,但我没能。
[root@headnode.mintrop.usp.br ~]# beegfs-ctl --removetarget 13给定的目标是好友镜像组的一部分。正在中止。
[root@n13 ~]# beegfs-ctl --removemirrorgroup --mirrorgroupid=7 --nodetype=storage --dry-run无法删除好友组:通信错误
我认为我们做错了什么,因为伙伴镜像设置,有时是困难的。
任何帮助都是非常感谢的。谢谢。
PS:为了完整起见,检查似乎没问题:
[root@headnode.mintrop.usp.br ~]# beegfs-df元数据服务器: TargetID限制。池总游离% ITotal IFree % ======== ===============================1正常218.2GiB 66.9GiB 31% 109.2M 107.8M 99%
存储目标: TargetID帽。池总自由% ITotal IFree % ======== ===============================
[来自beegfs的错误-存储n13.mintrop.usp.br ID: 13:未知存储目标] 13紧急情况0.0GiB 0.0GiB 0% 0.0M 0.0M 0%
发布于 2022-09-22 13:34:24
解决方案:问题出现在使用与头节点所看到的输入不同的节点上。头节点看到下面的文件,该文件按升序对应于每个节点(n01,n02...n14):
[root@headnode ~]# cat /data1/beegfs/mgmtd/targetNumIDs
0-5E3B6573-1=1
0-5E3B6592-2=2
0-5E3B65B2-3=3
0-5E3B65D1-4=4
0-5E3B65F1-5=5
0-5E3B6610-6=6
0-5E3B6630-7=7
0-5E3B664F-8=8
0-5E3B666E-9=9
0-5E3B6690-A=A
0-5E3B66B1-B=B
0-5E3B66D2-C=C
0-5E3B66F3-D=D
0-5E3B6714-E=E
0-626C29BD-D=F
0-62853797-D=10在n13文件/data1 1/beegfs/storage/targetID中,十号为0-62853797-D=10。如果进行计算,这相当于十进制中的16位:
[root@headnode~]# echo "obase=16; 16" | bc
10因此,解决方案是将targetID更改为与数字13对应的十六进制:
[root@headnode~]# echo "obase=16; 13" | bc
Dhn's /data1 1/beegfs/mgmtd/targetNumIDs文件中的这个值对应于0-5E3B66F3-D=D,因此对n13进行了两个更改。在targetNumID和targetID文件中,分别有16和0-62853797-D=10的文件被替换为:
[root@n13 ~]# cat /data1/beegfs/storage/targetNumID
13
[root@n13 ~]# cat /data1/beegfs/storage/targetID
0-5E3B66F3-D完成后,重新启动beegfs-存储服务beegfs-meta。
root@headnode~]# beegfs-ctl --listtargets --nodetype=storage --state
TargetID Reachability Consistency NodeID
======== ============ =========== ======
1 Online Good 1
2 Online Good 2
3 Online Good 3
4 Online Good 4
5 Online Good 5
6 Online Good 6
7 Online Good 7
8 Online Good 8
9 Online Good 9
10 Online Good 10
11 Online Good 11
12 Online Good 12
13 Online Good 13
14 Online Good 14向杰奎琳问好
https://stackoverflow.com/questions/73801722
复制相似问题