自从我升级到Xenial以来,我已经追踪这个问题大约6周了。最初认为它是随机的,但发现使用USB串行适配器引发了这个问题。无论是在USB2上还是在PCI-E USB3附加卡上都无所谓。将在文本控制台和/或串行控制台上产生以下消息(我已经启用了ob-board串行端口):
NMI watchdog: Watchdog detected hard LOCKUP on cpu 0
NMI watchdog: Watchdog detected hard LOCKUP on cpu 2
NMI watchdog: Watchdog detected hard LOCKUP on cpu 3
NMI watchdog: Watchdog detected hard LOCKUP on cpu 4
NMI watchdog: Watchdog detected hard LOCKUP on cpu 5
NMI watchdog: Watchdog detected hard LOCKUP on cpu 6
NMI watchdog: Watchdog detected hard LOCKUP on cpu 8
NMI watchdog: Watchdog detected hard LOCKUP on cpu 11等。
这台机器有16个核心,所有的都会迅速地连续锁定,需要重新设置。
我运行的是最新的内核(LinuxImage-4.4.0-72-泛型)。我尝试了4.8,但是受到了MTU错误(https://bugs.launchpad.net/ubuntu/+source/linux-hwe-edge/+bug/1679823)的影响。我尝试了4.10,但这有某种KVM错误(我还在主机上运行了几个VM)。
我试着替换内存(即使是ECC内存)、替换主板、替换NIC,但都没有效果。我找不到其他人报告没有绑定到特定用户进程的多CPU锁,所以我认为我有坏的硬件。
发布于 2017-05-17 17:58:50
我按照指令为4.8 (https://wiki.ubuntu.com/Kernel/BuildYourOwnKernel)构建了自己的内核,并构建了Linux-Image-4.8.0-53通用的内核。这已经解决了我的锁,MTU问题,没有KVM恐慌。由于我浪费了6个星期来解决这个问题,希望其他人发现它有用。
https://askubuntu.com/questions/916195
复制相似问题