我在一个运行在Ubuntu1110服务器上的3ware 9690卡上有一个RAID10 (8x1TB)数组。
有一个内核更新,所以我安排了一个重新启动,然后数组就无法访问了。我检查了驱动器在数组中已死的状态,但是控制器将整个数组抛入“不可操作”状态,而不是简单地降级(现在RAID的意义是什么;-)。
在取出‘死’驱动器后,我运行了一个快速测试,以发现它完全功能,没有一个坏的扇区可以找到。
我试着把驱动器放回去,但是数组仍然将磁盘标记为降级(记得序列号还是什么的?)整个数组都无法操作..。
所以我把它换成了一个已知的工作驱动器(不是相同的容量,而是更高的工作能力-应该还能工作),并开始重新构建新驱动器作为替代。"(0x0B:0x0033):单元繁忙:在单元0上启动重建失败“立即失败。这个单元不应该很忙,因为它没有被挂载(卡片本身是用lshw列出的,但是它提供的数组不是)。
我现在几乎陷入僵局,我不明白我怎么能在RAID10上有一个驱动器故障,使整个数组无法访问,降级,我可以理解,但无法访问?我不认为控制器是错误的,因为在重新启动之前,它是完全功能的。
> info c0Unit UnitType Status %RCmpl %V/I/M Stripe Size(GB) Cache AVrfy
------------------------------------------------------------------------------
u0 RAID-10 INOPERABLE - - 256K 3725.25 Ri ON
VPort Status Unit Size Type Phy Encl-Slot Model
------------------------------------------------------------------------------
p0 OK u0 931.51 GB SATA 0 - SAMSUNG HD103SJ
p1 OK u0 931.51 GB SATA 1 - SAMSUNG HD103SJ
p2 OK u0 931.51 GB SATA 2 - SAMSUNG HD103SJ
p3 OK u0 931.51 GB SATA 3 - SAMSUNG HD103SJ
p4 OK u0 931.51 GB SATA 4 - SAMSUNG HD103SJ
p5 OK - 1.36 TB SATA 5 - ST31500341AS
p6 OK u0 931.51 GB SATA 6 - SAMSUNG HD103SJ
p7 OK u0 931.51 GB SATA 7 - SAMSUNG HD103SJ> /c0/u0 start rebuild disk=5Sending rebuild start request to /c0/u0 on 1 disk(s) [5] ... Failed.
(0x0B:0x0033): Unit busy发布于 2011-12-02 06:49:06
联系了LSI支持和他们的一位二级技术人员疯狂地写了一个脚本&固件黑客,使数组进入一个正常的降级状态。
从那时起,就像往常一样,将一个新磁盘加入到数组中并进行重新构建。
https://serverfault.com/questions/335280
复制相似问题