我们有一个戴尔PowerEdge R820运行VMware ESXi,它在过去两个月中出现了多个CPU错误。它最初在CPU1上有一个IERR,现在显示CPU3的CPU检查错误。我换掉了CPU3 --> CPU2和CPU1 --> CPU4,看看错误是否会跟随处理器。在交换之后,服务器在我执行另一个DSET之前已经打开了大约72小时,并且没有出现更多的硬件错误。我想在CPU和内存上运行一个压力测试,测试时间约为24小时,以验证当我们投入生产时,它是否能够处理负载。这可能是CPU在发货期间(在我们开始接收第一个错误之前)被转移的原因。
问题是,我不知道任何压力测试工具为我的特定设置。我试过使用布雷金,但是它不能正确地引导到它。(挂在“loading sb_edac”上)。有什么工具可以推荐我来测试运行R820的VMware ESXi (IntelXeone5-4600)?
发布于 2013-09-17 13:44:24
在本例中,您只需加载包含stress工具的Linux或救援CD (我更喜欢PLD Linux光盘),并将服务器放在循环中。
然而,我会非常依赖戴尔的支持,并取代系统板/CPU和/或RAM。服务器不健康!调试这种类型的东西可能不太有效。
你捕捉到ESXi系统的转储了吗?支援日志?
https://serverfault.com/questions/539555
复制相似问题