我有一个超级微型服务器与一个LSI MegaRAID SAS9261-8i Raid控制器在里面。控制器上附加了3个磁盘,配置为RAID5阵列。其中一个磁盘最近发生故障(RAID显示为降级),在检查了S.M.A.R.T的信息后,发现它必须更换。
我使用storcli将驱动器标记为“丢失”,并将该驱动器移至供应商。现在磁盘的替代品到了,我把它插到了RAID控制器上,但什么也没发生。斯托克利是这么说的:
storcli /c0 show
TOPOLOGY :
========
------------------------------------------------------------------------
DG Arr Row EID:Slot DID Type State BT Size PDC PI SED DS3 FSpace
------------------------------------------------------------------------
0 - - - - RAID5 Dgrd N 5.456 TB dflt N N none Y
0 0 - - - RAID5 Dgrd N 5.456 TB dflt N N none Y
0 0 0 - - DRIVE Msng - 2.728 TB - - - - -
0 0 1 252:5 14 DRIVE Onln N 2.728 TB dflt N N none -
0 0 2 252:2 11 DRIVE Onln N 2.728 TB dflt N N none -
------------------------------------------------------------------------如您所见,插槽2和5中的两个驱动器都处于联机状态,设备组(DG)的另一个驱动器被标记为丢失。第三个驱动器过去位于插槽0中,而替换驱动器现在位于插槽1中。但是控制器无法识别新驱动器,就像您在物理设备列表中看到的那样(输出来自上面相同的命令):
Physical Drives = 2
PD LIST :
=======
-----------------------------------------------------------------------------
EID:Slt DID State DG Size Intf Med SED PI SeSz Model Sp
-----------------------------------------------------------------------------
252:2 11 Onln 0 2.728 TB SATA HDD N N 512B WDC WD3000FYYZ-01UL1B0 U
252:5 14 Onln 0 2.728 TB SATA HDD N N 512B WDC WD3000FYYZ-01UL1B0 U
-----------------------------------------------------------------------------与此形成对比的是,请参见以下输出:
storcli /c0/pall show
PhyInfo :
=======
----------------------------------------------------------------------------
PhyNo SAS_Addr Phy_Identifier Link_Speed Device_Type Description
----------------------------------------------------------------------------
0 0x0000000000000000 0 No limit - -
1 0x4433221101000000 0 No limit End Device -
2 0x0000000000000000 0 No limit - -
3 0x0000000000000000 0 No limit - -
4 0x4433221104000000 0 No limit End Device -
5 0x0000000000000000 0 No limit - -
6 0x4433221106000000 0 No limit End Device -
7 0x0000000000000000 0 No limit - -
----------------------------------------------------------------------------我猜PhyNo 1是被替换的驱动器,但这是我能找到它的踪迹的唯一命令。所有针对Slot 1的时隙特定命令都以Drive not found结束。
对此有什么想法吗?我在第二台服务器(也是相同的RAID控制器)中测试了被替换的驱动器,在该服务器中,Controller检测立即标记为UGood的驱动器,这意味着Unconfigured Good,因此不可能是驱动器错误。我还做了一些重新启动,关机几分钟,并尝试使用LSI MegaRaid BIOS,同时启动以检测新驱动器,但没有成功。驱动器不会出现在LSI MegaRaid BIOS引导消息中。
任何暗示都将不胜感激。
发布于 2014-04-16 23:27:23
事实证明,这种行为是由饥饿的HDD引起的,而HDD是被取代的。我没有得到它,因为第二服务器识别新的硬盘没有问题,但也许这是这个处女硬盘的最后一口气。
我没有料到数据中心级HDD (WD RE系列,在你问之前)会出现缺陷,我会意识到它在未来,在我浪费时间的时间。
https://serverfault.com/questions/587925
复制相似问题