问题:
有没有办法迫使它重建?我也在尝试关闭系统并尝试在3 3ware控制器BIOS中重建它。如果我在当前状态下关闭这个系统,它会恢复吗?还是数组会被破坏,不能引导?目前,该系统已投入运行。
详细信息:
进入一个坏数组(降级),另三个正在初始化。我更换了坏磁盘,并试图重建。使用以下命令:
./tw_cli /c3/p1 remove
./tw_cli /c3 rescan
./tw_cli maint rebuild c3 u0 p1RAID数组表示它正在重建,但自从我发出“重建”命令后就没有移动过。
~ # ./tw_cli /c3/u0 show
Unit UnitType Status %RCmpl %V/I/M Port Stripe Size(GB)
------------------------------------------------------------------------
u0 RAID-10 REBUILDING 29% - - 256K 1862.61
u0-0 RAID-1 REBUILDING 0% - - - -
u0-0-0 DISK OK - - p0 - 465.651
u0-0-1 DISK DEGRADED - - p1 - 465.651
u0-1 RAID-1 INITIALIZING 62% - - - -
u0-1-0 DISK OK - - p2 - 465.651
u0-1-1 DISK OK - - p3 - 465.651
u0-2 RAID-1 INITIALIZING 40% - - - -
u0-2-0 DISK OK - - p4 - 465.651
u0-2-1 DISK OK - - p5 - 465.651
u0-3 RAID-1 INITIALIZING 16% - - - -
u0-3-0 DISK OK - - p6 - 465.651
u0-3-1 DISK OK - - p7 - 465.651
u0/v0 Volume - - - - - 1862.61我尝试在已启用和禁用重新生成计划的情况下重建数组:
~ # ./tw_cli /c3 show rebuild
Rebuild Schedule for Controller /c3
========================================================
Slot Day Hour Duration Status
--------------------------------------------------------
1 Sun 12:00am 24 hr(s) enabled
2 Mon 12:00am 24 hr(s) enabled
3 Tue 12:00am 24 hr(s) enabled
4 Wed 12:00am 24 hr(s) enabled
5 Thu 12:00am 24 hr(s) enabled
6 Fri 12:00am 24 hr(s) enabled
7 Sat 12:00am 24 hr(s) enabled我已经尝试过启用和禁用验证计划。
~ # ./tw_cli /c3 show verify
Verify Schedule for Controller /c3
========================================================
Slot Day Hour Duration Status
--------------------------------------------------------
1 Sun 12:00am 24 hr(s) enabled
2 Mon 12:00am 24 hr(s) enabled
3 Tue 12:00am 24 hr(s) enabled
4 Wed 12:00am 24 hr(s) enabled
5 Thu 12:00am 24 hr(s) enabled
6 Fri 12:00am 24 hr(s) enabled
7 Sat 12:00am 24 hr(s) enabled还请注意,尝试将ignoreECC设置为out错误:
~ # ./tw_cli /c3/u0 show ignoreECC
/c3/u0 Ignore ECC policy = off
~ # ./tw_cli /c3/u0 set ignoreECC=on
Setting Ignore ECC Policy on /c3/u0 to [on] ... Failed.
(0x09:0x0005): (0x09:0x0005): Input/output errorEdit 3/15/18:我想我应该把发生的事情写下来,以防其他人发现自己处于类似的情况。我不得不说,被卡住的初始化是真正让我陷入循环的一部分。我知道一些RAID卡,每周重新确认一次数组。(或者当你安排他们去的时候。)我相信发生了什么,这是去重新同步和验证数组和一个或多个驱动器失败,在重新同步期间,导致‘初始化’停止。
我给这张RAID卡发了邮件支持。(dcsg.support@broadcom.com)他们查看了日志和图表,没有发现任何异常的东西。他们的建议最终是:“更新固件。升级后重新启动。这可能有助于摆脱暂停状态。”
我问他们在“初始化”状态下更新固件是否安全,以及他们是否确定在这种状态下重新启动是安全的。他们再也不会重播那封邮件了。
由于我不信任任何人,所以我备份了所有的数据,重新启动了机器。又出现了两个坏磁盘。(它们是初始化RAID1数组上的坏磁盘。)幸运的是,它们都在不同的RAID1阵列上,所以我可以替换坏磁盘。在重新启动和重新构建数组之后,它们初始化,现在一切都正常工作。
如果你看到这张卡住在“初始化”,我会备份数据,尝试重新启动,并祈祷坏的磁盘在不同的镜像上。
祝所有将来可能读到这篇文章的人好运!
发布于 2018-03-15 18:02:51
我想我应该把发生的事情写下来,以防其他人发现自己处于类似的情况。我不得不说,被卡住的初始化是真正让我陷入循环的一部分。我知道一些RAID卡,每周重新确认一次数组。(或者当你安排他们去的时候。)我相信发生了什么,这是去重新同步和验证数组和一个或多个驱动器失败,在重新同步期间,导致‘初始化’停止。
我给这张RAID卡发了邮件支持。(dcsg.support@broadcom.com)他们查看了日志和图表,没有发现任何异常的东西。他们的建议最终是:“更新固件。升级后重新启动。这可能有助于摆脱暂停状态。”
我问他们在“初始化”状态下更新固件是否安全,以及他们是否确定在这种状态下重新启动是安全的。他们再也不会重播那封邮件了。
由于我不信任任何人,所以我备份了所有的数据,重新启动了机器。又出现了两个坏磁盘。(它们是初始化RAID1数组上的坏磁盘。)幸运的是,它们都在不同的RAID1阵列上,所以我可以替换坏磁盘。在重新启动和重新构建数组之后,它们初始化,现在一切都正常工作。
如果你看到这张卡住在“初始化”,我会备份数据,尝试重新启动,并祈祷坏的磁盘在不同的镜像上。
祝所有将来可能读到这篇文章的人好运!
https://serverfault.com/questions/894673
复制相似问题