我有几个存储阵列,其中相当多的驱动器已经启动了25,000至30,000小时(2.8 -3.4年)。这些驱动器没有其他问题或错误。
我想知道的是:是否有一个点,仅凭驾驶年龄就足以取代驱动器,即使驱动器工作正常且没有错误?
(我很好奇,看看人们是否倾向于开车,直到他们失败或开始抛出错误,或者是否有人采取积极主动的方法来代替使用功率作为一个指标。)
驱动器制造商一般对企业驱动器的MTBF报价为1,000至1,500,000小时,但在现实世界中,这些数字并不意味着什么。
我确实找到了2007年完成的这项研究:
现实世界中的磁盘故障: 1,000,000小时的MTTF对您意味着什么?
http://www.cs.cmu.edu/~bianca/fast07.pdf
这项研究表明,在1年到5-7年的时间里,你会发现一个“甜蜜的地方”,在那里,你可以预期的失败会少一些。这些时期之前/之后的驾驶年龄往往要高得多。
发布于 2014-01-25 17:45:26
不是的。
当驱动器发生故障时,你可以替换它们(或者你得到了预测失败,比如智能驱动器),而不仅仅是因为它们已经到了一定的年龄。我见过驾驶时间超过15年,而驾驶失败不到一个小时,所以年龄不是驾驶失败的一个很好的指标。
发布于 2014-01-24 17:44:55
我见过有10-15年历史的服务器,原来的驱动器还在运行,它们的功能没有改变。我见过不到一年的服务器出现了灾难性的驱动器故障。
我对运行一个驱动器的做法有多好/有多差没有什么看法,直到它显示出故障,所以我的回答是“它取决于”--备份、数据/工具的价值、驱动器的大小、活动的强度,如果是镜像数组的话,以及如果可以提供更换它的停机时间--这可能比仅仅的硬件更昂贵。
我认为基于这些事情和其他特定于您的站点和应用程序的变量--它需要是您的团队做出的决定,而不是一些死记硬背的年龄值。
编辑:如果数据或正常运行时间很重要,可以考虑使用备份和灾难恢复策略,使用冗余服务器,并使用来自不同批的驱动器镜像数组。通过这种方式,您不太可能同时发生所有故障,因此您将能够故障到正常工作的硬件,而坏的硬件将被替换而不会丢失数据。
发布于 2014-01-24 17:48:54
我从未见过(或听说过)任何仅仅因为驱动器“太老”而更换它们的人(同时在生产中保持存储/服务器)。
https://serverfault.com/questions/569688
复制相似问题