我的for主机为专用服务器提供了两种不同类型的高可用性选项:
与硬盘故障相比,电源故障有多常见?我知道如果不知道确切的硬件,就不可能知道确切的数字,但目前大概的数字对我来说已经足够好了。
谢谢,
禤浩焯
发布于 2011-01-10 16:51:47
我通常看到硬盘的故障远远超过电源。在任何一年,我可能会更换20或30个硬盘驱动器,也许只有3或4个电源。关于冗余电源,有一点要注意,如果它们只是多余的--它很好,如果它们是负载平衡+冗余--它太棒了。除了一对直接的闪电击中,在不同的客户,我从来没有担心冗余/负载平衡电源变坏。在负载平衡方面,有一些东西能够真正帮助保持电力供应的健康。当负载平衡时,我经常在更换电源之前更换整个服务器。
发布于 2011-01-10 17:11:48
这里最大的因素之一是在电力供应之前对电源进行调节。服务器类型的硬件往往受到UPS的保护,这似乎通常会延长电源的使用寿命,因为它得到的正弦波要干净得多,并且通常受到的干扰要少得多。服务器上的电源(和大多数风扇)在运行时往往会出现故障。几年来一直不停运行的电源和风扇一旦断电,就会突然放弃供电,并拒绝恢复供电。如果电源在仍处于活动状态时出现故障,则可能会导致服务器出现随机冻结或其他行为异常并停止响应。
硬盘似乎是随机故障,很少或根本没有注意到。RAID1是一个不错的解决方案(RAID6更好,您可以从驱动器中获得更多的容量,并且可以同时承受两个故障)。RAID的问题是,您需要有相同的驱动器来替换失败的驱动器,而且这些驱动器在事实发生后很难找到,因此建议您与原始驱动器一起购买替换驱动器,并将它们放在手边。当从网络主机租用专用服务器时,他们会声称已经做到了这一点,但在某一时刻,他们会用不同的驱动器构建新的服务器,最终耗尽您的阵列所用的驱动器,这可能意味着当您的时间到来时,您将无法进行热交换。此外,谷歌对硬盘进行了广泛的研究,他们发现硬盘要么几乎马上就死了(大约在一个月左右),要么持续几年,尽管相同的硬盘可能在同一时间出现故障,这正是RAID6的优势所在。(缺点是它需要更多的驱动器和更昂贵的控制器)
如果你能负担得起的话,就把所有的东西都裁掉。如果你不能,你应该再次问你自己,如果你真的有能力不这样做。
发布于 2011-01-10 18:30:57
在我15年的戴尔和惠普服务器工作经验中,我可以告诉你,你可以测量每年发生故障的驱动器的数量,而另一方面,你可以测量电源故障之间的时间。
https://serverfault.com/questions/220708
复制相似问题