根据我的经验,每一个硬盘都会失败,这只是时间问题。
我已经很辛苦地吸取了教训,现在我做了后援。
当我购买新的驱动器时,我经常将我的驱动器列表与保修期分开。硬盘制造商在那里是为了赚钱,很明显,大多数时候,他们设计的硬盘至少能维持保修期。因此,在这段时间之后,我预计失败率会更高。我已经在RAID 5的3个驱动器中有2个同时失败了(第二个驱动器在重构数组时失败了,是的,我有一个最近的备份)。
我的问题是:在保修后的RAID中预防性更换硬盘的最佳做法是什么?
你在乎吗?你要替换多少个驱动器?
关于答复的说明
创建新数组时:使用来自不同制造商/批处理的驱动器。
当有一个已经旧的数组时:添加一个新的备用。
发布于 2009-05-30 12:18:02
这取决于你是在谈论服务器级设备还是桌面级设备。
如果它是一台台式机,是用你自己的钱和现成的驱动器建造的,而且你不担心兼容性,那么是的,你的策略是合理的。每隔X年,出去买所有的新驱动器,以取代你目前的驱动器。它们会更快,更安静,更大。您可以单独替换驱动器,让数组重新构建自己,然后当重建完成后,将数组重新配置为更大。(并不是所有的raid适配器都支持这样的操作--在线重建和大小更改。)
如果它是像HP Proliant或IBM这样的服务器类计算机,它就会变得更加复杂。您可能需要在raid适配器的兼容性列表上使用硬盘驱动器。在这种情况下,驱动器将是昂贵的,因为它们可能不再生产,或者它们只是简单的昂贵开始在服务器类的东西无论如何。更糟糕的是,你可能会从你的经销商那里购买旋转设备而不知道--这在服务器经销商中并不少见。
另外,你可能会丢弃寿命非常好的驱动器,用注定会有麻烦的驱动器取代它们。与其主动替换它们,不如首先使用热备用来构建服务器,并确保raid数组支持使用热备用自动重新构建。然后,重建将发生在你甚至起床,使它进入数据中心,你可以在空闲时更换死机,而不花费金钱或时间。
发布于 2009-05-30 12:04:25
谷歌对硬盘故障率的研究显示,年龄与年龄之间的相关性比先前所怀疑的要小。我听到的最好的建议是避免从一批或一家制造商创建磁盘阵列。谷歌的研究表明,来自类似的生产批次的驱动器之间存在着很强的相关性,它们同时失败。
如果您关心RAID数据集的可靠性,我强烈的建议是迁移到RAID10,或者失败RAID6。
考虑到MTBF和每Gb读取的错误率,在重建退化的RAID5集时出现双重故障的可能性太高,无法在当今市场上使用兆字节大小的驱动器。参考文献http://hardware.slashdot.org/hardware/08/10/21/2126252.shtml
发布于 2009-05-30 16:19:59
我会百分之百同意同样的一批驱动器都失败在一起。我有10个戴尔工作站,经过4年,我有6个驱动器都失败了12个月的彼此。
在生产服务器方面,我总是从戴尔这样的地方购买,并确保他们至少在我计划维持服务器运行的时间(通常为4年)内储存备件。
我有3台带有RAID的服务器在我身上出现了驱动器故障。我从来没有热备件,但戴尔给我第二天的替换,重建工作很快就完成了。再加上适当的备份,你应该会没事的。
https://serverfault.com/questions/15531
复制相似问题