首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >3ware 9550SX RAID-10,一个退化的驱动器,重建和初始化卡住

3ware 9550SX RAID-10,一个退化的驱动器,重建和初始化卡住
EN

Server Fault用户
提问于 2018-01-29 20:19:26
回答 1查看 1.2K关注 0票数 0

问题:

有没有办法迫使它重建?我也在尝试关闭系统并尝试在3 3ware控制器BIOS中重建它。如果我在当前状态下关闭这个系统,它会恢复吗?还是数组会被破坏,不能引导?目前,该系统已投入运行。

详细信息:

进入一个坏数组(降级),另三个正在初始化。我更换了坏磁盘,并试图重建。使用以下命令:

代码语言:javascript
复制
./tw_cli /c3/p1 remove
./tw_cli /c3 rescan
./tw_cli maint rebuild c3 u0 p1

RAID数组表示它正在重建,但自从我发出“重建”命令后就没有移动过。

代码语言:javascript
复制
~ # ./tw_cli /c3/u0 show

Unit     UnitType  Status         %RCmpl  %V/I/M  Port  Stripe  Size(GB)
------------------------------------------------------------------------
u0       RAID-10   REBUILDING     29%     -       -     256K    1862.61   
u0-0     RAID-1    REBUILDING     0%      -       -     -       -         
u0-0-0   DISK      OK             -       -       p0    -       465.651   
u0-0-1   DISK      DEGRADED       -       -       p1    -       465.651   
u0-1     RAID-1    INITIALIZING   62%     -       -     -       -         
u0-1-0   DISK      OK             -       -       p2    -       465.651   
u0-1-1   DISK      OK             -       -       p3    -       465.651   
u0-2     RAID-1    INITIALIZING   40%     -       -     -       -         
u0-2-0   DISK      OK             -       -       p4    -       465.651   
u0-2-1   DISK      OK             -       -       p5    -       465.651   
u0-3     RAID-1    INITIALIZING   16%     -       -     -       -         
u0-3-0   DISK      OK             -       -       p6    -       465.651   
u0-3-1   DISK      OK             -       -       p7    -       465.651   
u0/v0    Volume    -              -       -       -     -       1862.61

我尝试在已启用和禁用重新生成计划的情况下重建数组:

代码语言:javascript
复制
~ # ./tw_cli /c3 show rebuild                    

Rebuild Schedule for Controller /c3
========================================================
Slot    Day     Hour            Duration        Status
--------------------------------------------------------
1       Sun     12:00am         24 hr(s)        enabled
2       Mon     12:00am         24 hr(s)        enabled
3       Tue     12:00am         24 hr(s)        enabled
4       Wed     12:00am         24 hr(s)        enabled
5       Thu     12:00am         24 hr(s)        enabled
6       Fri     12:00am         24 hr(s)        enabled
7       Sat     12:00am         24 hr(s)        enabled

我已经尝试过启用和禁用验证计划。

代码语言:javascript
复制
~ # ./tw_cli /c3 show verify

Verify Schedule for Controller /c3
========================================================
Slot    Day     Hour            Duration        Status
--------------------------------------------------------
1       Sun     12:00am         24 hr(s)        enabled
2       Mon     12:00am         24 hr(s)        enabled
3       Tue     12:00am         24 hr(s)        enabled
4       Wed     12:00am         24 hr(s)        enabled
5       Thu     12:00am         24 hr(s)        enabled
6       Fri     12:00am         24 hr(s)        enabled
7       Sat     12:00am         24 hr(s)        enabled

还请注意,尝试将ignoreECC设置为out错误:

代码语言:javascript
复制
~ # ./tw_cli /c3/u0 show ignoreECC
/c3/u0 Ignore ECC policy = off 

~ # ./tw_cli /c3/u0 set ignoreECC=on
Setting Ignore ECC Policy on /c3/u0 to [on] ... Failed.
(0x09:0x0005): (0x09:0x0005): Input/output error

Edit 3/15/18:我想我应该把发生的事情写下来,以防其他人发现自己处于类似的情况。我不得不说,被卡住的初始化是真正让我陷入循环的一部分。我知道一些RAID卡,每周重新确认一次数组。(或者当你安排他们去的时候。)我相信发生了什么,这是去重新同步和验证数组和一个或多个驱动器失败,在重新同步期间,导致‘初始化’停止。

我给这张RAID卡发了邮件支持。(dcsg.support@broadcom.com)他们查看了日志和图表,没有发现任何异常的东西。他们的建议最终是:“更新固件。升级后重新启动。这可能有助于摆脱暂停状态。”

我问他们在“初始化”状态下更新固件是否安全,以及他们是否确定在这种状态下重新启动是安全的。他们再也不会重播那封邮件了。

由于我不信任任何人,所以我备份了所有的数据,重新启动了机器。又出现了两个坏磁盘。(它们是初始化RAID1数组上的坏磁盘。)幸运的是,它们都在不同的RAID1阵列上,所以我可以替换坏磁盘。在重新启动和重新构建数组之后,它们初始化,现在一切都正常工作。

如果你看到这张卡住在“初始化”,我会备份数据,尝试重新启动,并祈祷坏的磁盘在不同的镜像上。

祝所有将来可能读到这篇文章的人好运!

EN

回答 1

Server Fault用户

发布于 2018-03-15 18:02:51

我想我应该把发生的事情写下来,以防其他人发现自己处于类似的情况。我不得不说,被卡住的初始化是真正让我陷入循环的一部分。我知道一些RAID卡,每周重新确认一次数组。(或者当你安排他们去的时候。)我相信发生了什么,这是去重新同步和验证数组和一个或多个驱动器失败,在重新同步期间,导致‘初始化’停止。

我给这张RAID卡发了邮件支持。(dcsg.support@broadcom.com)他们查看了日志和图表,没有发现任何异常的东西。他们的建议最终是:“更新固件。升级后重新启动。这可能有助于摆脱暂停状态。”

我问他们在“初始化”状态下更新固件是否安全,以及他们是否确定在这种状态下重新启动是安全的。他们再也不会重播那封邮件了。

由于我不信任任何人,所以我备份了所有的数据,重新启动了机器。又出现了两个坏磁盘。(它们是初始化RAID1数组上的坏磁盘。)幸运的是,它们都在不同的RAID1阵列上,所以我可以替换坏磁盘。在重新启动和重新构建数组之后,它们初始化,现在一切都正常工作。

如果你看到这张卡住在“初始化”,我会备份数据,尝试重新启动,并祈祷坏的磁盘在不同的镜像上。

祝所有将来可能读到这篇文章的人好运!

票数 1
EN
页面原文内容由Server Fault提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://serverfault.com/questions/894673

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档