我有一个RAID1数组,其中有一个损坏严重的磁盘/dev/sdb。我在这个数组中放置了一个新的硬盘/dev/sda,以便镜像sdb (然后我将用一个新的硬盘替换sdb )。
# cat /proc/mdstat
Personalities : [raid1] [linear] [multipath] [raid0] [raid6] [raid5] [raid4] [raid10]
md0 : active raid1 sda2[2] sdb2[1]
999872 blocks super 1.2 [2/2] [UU]
md1 : active raid1 sda3[2] sdb3[1]
1952380736 blocks super 1.2 [2/1] [_U]
[>....................] recovery = 2.7% (53083136/1952380736) finish=640.0min speed=49453K/sec
unused devices: <none>但这一“恢复”过程在30%左右停止:
# cat /proc/mdstat
Personalities : [raid1] [linear] [multipath] [raid0] [raid6] [raid5] [raid4] [raid10]
md0 : active raid1 sda2[2] sdb2[1]
999872 blocks super 1.2 [2/2] [UU]
md1 : active raid1 sda3[2](S) sdb3[1]
1952380736 blocks super 1.2 [2/1] [_U]
unused devices: <none>我猜这里的问题是/dev/sdb有大约100个坏块(用badblocks -v -b 512 /dev/sdb > sdb-bads.log发现的)。无法从他们那里读/写:
# tail -n 2 sdb-bads.log
1039341414
1039341415
# dd if=/dev/sdb of=/dev/null bs=512 skip=1039341414 count=1
dd: error reading '/dev/sdb': Input/output error
0+0 records in
0+0 records out
0 bytes copied, 9.33531 s, 0.0 kB/s
# dd if=/dev/sdb of=/dev/null bs=512 skip=1039341415 count=1
dd: error reading '/dev/sdb': Input/output error
0+0 records in
0+0 records out
0 bytes copied, 3.36192 s, 0.0 kB/s我的问题是:
debugfs这样的工具可以处理物理文件系统,而不是虚拟突袭。sda同步期间跳过这些块(假设,我不介意丢失一些数据)以完成RAID1镜像过程?发布于 2019-08-19 13:11:35
最后,我不得不用badblocks -v -b 512 /dev/sdb > sdb-bads.log命令重写所有坏扇区(用hdparm --write-sector命令发现)。我丢失了一些数据,但至少现在我能够用新的硬盘替换sdb,并从sda中恢复。
https://unix.stackexchange.com/questions/535743
复制相似问题