首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >修复递归错误,但需要在x3850 x6 SLES12上重新启动

修复递归错误,但需要在x3850 x6 SLES12上重新启动
EN

Unix & Linux用户
提问于 2017-12-20 16:51:26
回答 1查看 3.2K关注 0票数 1

我们有几台新机器: x3850 x6。

除了一台机器之外,所有pxe都可以很好地引导,这会引起以下内核恐慌,看起来是一个令人兴奋的问题:

我们甚至不能在内核恐慌发生后,30-40秒后向上滚动.它太饿了,我连打字都打不出来。

任何人都有任何线索,问题可能是什么?如果是HW错误,那么该替换什么呢?中央处理器?主板?

  • BIOS设置与工作设置完全相同
  • 固件/bios版本与工作版本完全相同。
  • 尝试过冷引导,同样的内核恐慌
  • 尝试用内核参数启动:"acpi=off“--它只是在18秒时做了相同的内核恐慌,而不是在30-40秒时发出通常的恐慌。
  • 试过:“诺阿皮舞”-30-40秒后惊慌。
  • 试过:"acpi=off noapic nomodeset xforcevesa“- 30-40秒后恐慌。
  • 尝试:"isolcpus=0“引导参数,同样的内核恐慌,30-40秒后。
  • 试图引导一个松弛-5.6-PAE.iso-它启动正常!3.10.5 SMP PAE。但我们得用SLES。PAE内核只看到~65 GByte内存,如果这是一个有用的信息。
  • 尝试:https://www.memtest86.com/downloads/memtest86-iso.zip运行一个简单的memtest,但是在59秒的运行后没有内存错误,机器冻结了。->更新: Memtest86+从:http://www.memtest.org/#downiso没有冻结。

有一次我看到:“内核恐慌--而不是同步:看门狗在cpu 18上检测到了硬锁”--机器上有4个cpu,每个cpu有18个核心,所以不知道这是哪一个。

更新:使用"maxcpus=0“内核引导参数,它最终启动,但仍在调查,因为仍然说:”启动作业正在运行以激活LVM2逻辑卷(Xmin /无限制)“--但可能是CPU HW问题?

EN

回答 1

Unix & Linux用户

回答已采纳

发布于 2018-01-26 16:43:09

在emulex卡驱动程序升级之后,它不再出现内核恐慌。

版本11.0.270.24至11.4.1186.3

票数 1
EN
页面原文内容由Unix & Linux提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://unix.stackexchange.com/questions/412075

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档