我在Xenserver主机上配置了带有Perc H700卡的Raid 50,几周前,替换了一个失败的磁盘。raid已经重建,我现在正在通过omreport检查数组的状态:
# omreport storage vdisk
Controller PERC H700 Integrated (Slot 4)
ID : 0
Status : Critical
Name : Virtual Disk 0
State : Resynching
Hot Spare Policy violated : Not Assigned
Virtual Disk Bad Blocks : Yes
Encrypted : Not Applicable
Layout : RAID-50
Size : 14,900.00 GB (15998753177600 bytes)
Associated Fluid Cache State : Not Applicable
Device Name : /dev/sda
Bus Protocol : SATA
Media : HDD
Read Policy : Adaptive Read Ahead
Write Policy : Write Through
Cache Policy : Not Applicable
Stripe Element Size : 64 KB
Disk Cache Policy : Enabled我的问题是,为什么政府这么长一段时间都在重新整合?没有太多的IO活动,因为目前主机上没有运行VM。再同步还涉及到什么?
要提到的另一点是,电池状态是至关重要的:
# omreport storage battery
Controller PERC H700 Integrated (Slot 4)
ID : 0
Status : Critical
Name : Battery 0
State : Failed
Recharge Count : Not Applicable
Max Recharge Count : Not Applicable
Learn State : Idle
Next Learn Time : 15 days 22 hours
Maximum Learn Delay : 7 days 0 hours
Learn Mode : Auto然而,使用Megacli,它显示电池是最佳的:
BBU status for Adapter: 0
BatteryType: BBU
Voltage: 4035 mV
Current: 0 mA
Temperature: 27 C
Battery State: Optimal这两份报告中冲突的原因是什么?
谢谢您,请询问您是否需要进一步的信息。
发布于 2015-07-22 15:20:08
在这个过程中,读取用于计算"resync“数据的磁盘可能会遇到一些不好的块。由于您使用的是RAID50,如果您在正在重建的“一半”(RAID5)驱动器中遇到任何不好的块,就会自动生成一个URE (被戴尔称为"穿刺")。
我这样说是因为你看到了Virtual Disk Bad Blocks : Yes -坏块不会发生在虚拟磁盘级别,除非底层的RAID由于多个块是坏的或丢失的而“丢失”了一个块。这就是为什么在RAID10或RAID6上生产数据通常要安全得多的原因之一。在我遇到的几乎每个使用虚拟级坏块的实例中,唯一的解决办法是重新初始化RAID并从备份中恢复。唯一的逃避方法是,如果该块恰好包含不需要读取的数据(或文件系统级别的空空间),并且最终被覆盖.否则,您可能会有某种程度的数据损坏,应该进行调查和解决。
至于电池状态的差异,我相信MegaCLI而不是omreport。MegaCLI来自OEM (LSI),专门针对这一任务而设计,omreport则负责监视所有的戴尔硬件组件。最有可能的是,重启OMSA服务或更新已安装的版本将消除差异。
如果你对系统有积极的保证,你也可以考虑联系戴尔就这两件事提出建议。
https://serverfault.com/questions/707657
复制相似问题