我正在寻求构建一个虚拟化服务器。然而,我问自己一个问题:我是否应该继续使用这个服务器上的非ECC?
这是因为我在预算中找到了一个Xeon。但是,如果我想要一个支持ECC的CPU,它就超出了当前的预算。
服务器将24/7运行大约10台虚拟机,Linux和Windows虚拟机混合运行。
关于这件事有什么看法吗?
发布于 2018-04-30 22:06:44
这取决于你是否有较高的内存损坏风险。
ECC不能完全保证所有错误都会被纠正或检测--但是它在检测甚至纠正相当多类型的故障方面做得很好。如果您的堆栈运行在单个节点上,而不是在多个节点上运行HA/复制,则这一点尤为重要。如果你只有一个作为真理来源的记忆池,你最好把它变成一个好的记忆池。
尽管如此,这一切都是关于用例的。假设你得到一个模块坏了(或者它很好,你住在恒星附近),你开始悄悄地破坏数据(我们这里没有使用ECC )。如果某些数据在检测到之前丢失或损坏,会影响您的业务吗?在大多数情况下,它是这样做的-因此值得花更多的钱在硬件上,以减少在这些情况下的可能性。
一般来说,应用程序及其开发人员在很大程度上依赖于数据路径的可靠性。一个不那么可靠的堆栈会浪费大量的管理员和开发人员时间吗?这最终可能会比仅仅购买更好的硬件更昂贵。
如果您的基础设施是集群和复制的,那么其中的一些特性就会得到缓解,因为有许多存储和应用程序系统无法执行跨多个硬件节点的数据集的校验和。在这些系统中,一个坏节点并不一定会破坏这些系统,因此在某些范围内,您可以减少每个节点的冗余和错误检查。不过,听起来并不是这样。
https://serverfault.com/questions/910096
复制相似问题