首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Cisco每天同时出现CPU故障

Cisco每天同时出现CPU故障
EN

Server Fault用户
提问于 2016-05-17 10:21:29
回答 1查看 114关注 0票数 1

情况

  • 最近从2.2升级到3.1(1e)。
  • 自从升级以来,每天早上6点51分(UTC+1),我在安装的B 200系列刀片的0到3(60%)之间都会出现故障。
  • 它总是相同的三个刀片,都在不同的底盘。
  • 故障表现为在SEL中使用“CPU预测失败”和“CATERR_N”消息的硬挂。
  • 动力
  • 在UCSM中,没有一次或重复的日程安排是在一天中的这个时间附近。
  • 思科TAC正在调查,但并没有透露为什么故障每天同时发生。

我的研究和怀疑

  • 我有一个工作理论,这些都是真正的硬件问题,在某种程度上已经暴露了固件升级。
  • 这里简短地提到了故障排除指南中的“传感器扫描管理器”,但是我找不到它做什么或如何监视它的任何细节。
  • 我几乎排除了一项环保事业。我们的功率和温度监测器当时没有什么不寻常之处。我们不在地震带:)

问题

为什么失败每天都在同一时间发生呢?

EN

回答 1

Server Fault用户

回答已采纳

发布于 2016-10-06 15:18:21

结果是固件版本3.1(1e)中的一个错误 (该链接所需的思科帐户)。它被描述为一个“罕见的事件”,涉及国际中心1340和调试中断。

每天都在同一时间发生的原因是-

  • 内存使用量大,其次是
  • 运行lspci

这正是木偶每天早上做的事情(我们每天只运行一次)。

不清楚为什么只有某些刀片受到此bug的影响,但是升级到3.1(1h)版本解决了这个问题。

票数 2
EN
页面原文内容由Server Fault提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://serverfault.com/questions/777232

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档