我有几台服务器(HP ProLiant DL380、DL360和DL120),它们都是用热备件安装的,还有一些带有外部磁盘的普通工作站。
我想为这些系统创建预防性的维护例程,并想知道哪些维护是可取的。
发布于 2012-08-16 11:24:25
对于具有热备件的服务器,故障时更换硬盘就足够了吗?
因此,这些可能是相同的磁盘模型,甚至可能来自同一生产批量。你有多自信每个人都会在不同的时候失败?好的,待机磁盘应该有一个非常不同的工作负载,这将有助于将它的故障与保存实际数据的磁盘(这显然必须在RAID数组中)错开,但是您的RAID阵列支持多个磁盘的故障吗?
也就是说,即使在文件系统仍然可以雪崩的情况下,您是否已经设置了监视和警报来检测失败的磁盘?
您可以通过捕获智能警报来主动监视磁盘运行状况,但您没有说明在这些警报上运行的是什么操作系统。运行周期性的表面扫描也是一个好主意(频率取决于数据的临界程度以及数据丢失会产生多大的影响--但不超过每月一次)。应该可以从RAID集中交换磁盘,然后在没有停机时间的情况下重新整合磁盘。事实上,如果你做得对,那么就不会对性能产生影响。
https://serverfault.com/questions/418173
复制相似问题