我们有几台戴尔1950年的服务器。其中一台服务器有CentOS6.3,它正在随机重新启动,因此我怀疑它是硬件(没有生成日志)。其他四台服务器不会随机重新启动。
我们在五台服务器上运行memtest86+,在其中三台服务器上运行memtest86+崩溃(显示一个奇怪的彩色屏幕,就像视频卡失败一样)。
我测试了一个旧的memtest86 (not +),没有一个服务器崩溃。我还测试了其他RAM测试实用程序,没有工具失败。
你们有经历过吗?
发布于 2012-12-22 08:44:12
如果memtest崩溃,很有可能您的内存很差。尝试替换来自非崩溃服务器的内存并重新运行memtest。很可能记忆是罪魁祸首。您还可以将内存减少到一半(系统允许;最小内存需求),并尝试运行memtest。一旦过了,试着用另一半来代替内存,看看。
发布于 2012-12-07 16:35:26
我有一个正在重新启动的Linux服务器,这通常意味着它是一个硬件问题。检查戴尔OMSA (戴尔开放经理系统管理员管理节点)中的日志。或者通过DRAC (戴尔远程访问卡)。
与戴尔技术支持部门联系,协助您进行问题调查。
发布于 2012-12-22 08:15:54
另一个可以用来帮助测试和诊断的工具是UBCD。它包括memtest和memtest+。新版本甚至有一个用于GPU的内存测试器。如果你怀疑视频也有问题,这会派上用场。
https://serverfault.com/questions/456110
复制相似问题