首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >惠普ProCurve 5412 on暖靴与不间断电源连接时电源故障

惠普ProCurve 5412 on暖靴与不间断电源连接时电源故障
EN

Server Fault用户
提问于 2016-02-18 12:36:53
回答 4查看 2.5K关注 0票数 4

我的客户的HP ProCurve 5412 HP底盘开关有时会重新启动,尽管它通过四个冗余电源供电,并且处于UPS保护之下。

这些重新启动通常发生在一个真正的停电或在棕色或低压事件。除开关外,所有附在不间断电源上的设备都没有工作。

机架用不间断电源是带跳台变压器的APC SmartUPS SUA3000XL 208 V。此交换机为整个设施的电话和接入点提供PoE。电池是健康的,最近更换,并有一个充分的充电。

这些闪光灯的作用是重新启动设施中的所有手机,并切断用户与其会话之间的连接。这是破坏性的。

在开关日志中:

代码语言:javascript
复制
 Keys:   W=Warning   I=Information
         M=Major     D=Debug E=Error
----  Event Log listing: Events Since Boot  ----
I 02/17/16 22:26:31 03802 chassis: System Self test started on  Master
I 02/17/16 22:26:31 03803 chassis: System Self test completed on  Master
I 02/17/16 22:26:35 00061 system: -----------------------------------------
I 02/17/16 22:26:35 00062 system: Mgmt Module 1 went down without saving crash
            information
M 02/17/16 22:26:35 03001 system: System reboot due to Power Failure

和版本信息:

代码语言:javascript
复制
valley-core# sh version
Image stamp:    /ws/swbuildm/rel_orlando_qaoff/code/build/btm(swbuildm_rel_orlando_qaoff_rel_orlando)
                Nov 19 2014 15:17:26
                K.15.16.0005
                335
Boot Image:     Secondary

多年来,我没有意识到你必须修改这个开关模型上的电源设置,但是这个单元被正确地配置,以利用多个PSU。

代码语言:javascript
复制
valley-core# sh power-over-ethernet

 Status and Counters - System Power Status

  System Power Status    : Full redundancy
  PoE Power Status       : Full redundancy

 Chassis power-over-ethernet:

  Total Available Power  :  600 W
  Total Failover Power   :  600 W
  Total Redundancy Power :  600 W
  Total Used Power       :  359 W +/- 6W
  Total Remaining Power  :  241 W

 Internal Power

        Main Power
  PS    (Watts)       Status
  ----- ------------- ---------------------
  1     300           POE+ Connected
  2     300           POE+ Connected
  3     300           POE+ Connected
  4     300           POE+ Connected

 External Power
        EPS1   /Not Connected.
        EPS2   /Not Connected.

补充PSU资料:

代码语言:javascript
复制
valley-core# sh system power-consumption

 Slot Power Usage:
 Slot  Module Description                        Current Power
 ----- ----------------------------------------- ---------------
 A     HP J9534A 24p Gig-T PoE+ v2 zl Module     18 W
 B     HP J9536A 20p GT PoE+/2p SFP+ v2 zl Mod   23 W
 C     HP J9534A 24p Gig-T PoE+ v2 zl Module     18 W
 D     HP J9534A 24p Gig-T PoE+ v2 zl Module     19 W
 E     HP J9534A 24p Gig-T PoE+ v2 zl Module     17 W
 F     HP J9534A 24p Gig-T PoE+ v2 zl Module     18 W
 G     HP J9534A 24p Gig-T PoE+ v2 zl Module     18 W
 H     HP J9534A 24p Gig-T PoE+ v2 zl Module     18 W
 K     HP J9534A 24p Gig-T PoE+ v2 zl Module     18 W
 L     HP J9534A 24p Gig-T PoE+ v2 zl Module     19 W

valley-core# sh system power-supply

Power Supply Status:

 PS#    Model       State        AC/DC  + V      Wattage
 ---- --------- ------------- ----------------- ---------
   1   Unknwn    Powered         AC 120V           875
   2   Unknwn    Powered         AC 120V           875
   3   Unknwn    Powered         AC 120V           875
   4   Unknwn    Powered         AC 120V           875

   4 /  4 supply bays delivering power.
   Total power: 3500 W

唯一的特点是开关是唯一失去动力的设备。没有一个连接的服务器有电源问题,尽管是在同一个电池或PDU上。

我可以承认,这个位置的电力是差的,遭受电压下降和偶尔的尖峰。但UPS在最近的暖启动过程中甚至没有记录故障。

我有另一个5412 in在一个无关的客户,已经做了多次相同的事情在过去。

对我能做什么有什么想法吗?我是否应该尝试将两个PSU移到公用电源上,而不是全部安装在UPS上?

编辑:

引导历史显示:

谷核# sh引导历史

代码语言:javascript
复制
Mgmt Module 1 -- Saved Crash Information (most recent first):
=============================================================
ID: 29008d6a
Active system went down: 02/01/16 09:23:54 K.15.16.0005 335
Switch rebooting due to temporary loss of power or low voltage

ID: 994a405a
Active system went down: 12/14/15 11:31:15 K.15.16.0005 335
switch rebooting due to temporary loss of power or low voltage

先前固件版本上的HP更改说明如下:

电源(CR_0000112424) -当开关暴露在交流功率波动和电压下降过低时,开关重新启动并产生错误的错误消息,称开关崩溃。通过此修复,错误消息将被更改为“由于暂时失去电源或低压而重新启动开关”。

这与这张技术报告是一致的。

EN

回答 4

Server Fault用户

回答已采纳

发布于 2016-02-18 13:08:12

我最初的想法和眼前的想法都和你所想的一样。如果这些闪点与您在UPS上设置的任何自测试计划无关(如果在进行自我测试时出现某些百分比的故障,那么您就会遇到UPS/变压器/负载问题),我会按照您的建议来做。将两个PSU移动到不同的提要,并查看是否再次出现闪点。如果他们这么做了--我不是在暗示这一点--就会向惠普提起诉讼。这可能是一个痛苦而乏味的过程。然而,它们可能会帮助提供指导,以获得真正的调试信息的开关。我也会花点时间检查一下最新版本的便笺/程序列表,看看开关上固件的最新版本。

票数 3
EN

Server Fault用户

发布于 2016-02-18 17:24:30

根据此页的说法,您的UPS系列属于“线交互”类型。这种指定意味着它不会不断地将公用电源转换为DC,然后再回到主电源级别。相反,它只是坐在那里监视电力和保持电池充电。输入功率直接通过,虽然它可以通过几个扼流圈和一个浪涌保护装置沿途额外的安全。

当公用电源下降或有电压下降时,UPS需要将其逆变器切换到电路中,以便开始向所连接的设备提供电池电源。不管这种切换是如何完成的(它要么是物理继电器,要么是固态继电器),你总是会看到几毫秒的“间隔”。此外,UPS的逆变器可能不会与公用电源同步,因此交流波形跳转到新的相位。

大多数设备并不关心输入电源是否会在几毫秒内丢失。电源中的电容器通常足够大,可以通过小间隙而不出问题。我见过许多服务器和网络设备需要几个完整的错过周期,而没有出现故障。

我怀疑这个特殊的开关的PSU比大多数的PSU都要重要一些。我认为您的问题可以通过获得另一个UPS (它在循环中不断地转换AC-DC-AC)来解决。这种类型的UPS通常被称为“联机”,尽管您应该与您的供应商检查以确认您得到了正确的类型。

票数 4
EN

Server Fault用户

发布于 2016-02-18 16:19:37

您刚才在编辑中添加的信息非常清楚。

出现了两个可能的原因:

1)当UPS实际需要工作时,它的输出电压略有下降,并且变化率很高,使开关认为它的功率状况很低。

我以前见过UPS设备也发生过这种情况。

唯一的解决办法是承担一些UPS或获得一个更大的UPS。

在某些情况下:如果UPS有多个输出电路,重新分配这些电路上的负载可能会有所帮助。理想情况下,每个电路或多或少都有相同的负载。这将使输出电压降到最小.

2)另一种可能性,尽管非常罕见,也适用于具有多个输出的UPS单元。考虑到它们所提供的AC的阶段,它可能不是完全同步的输出。

如果你的PSU用相位差连接到几个电路上,开关内部的电源板可能会出现同步问题,导致同样的问题。在这种情况下,解决方案是完全相反的:把所有东西放在同一条线路上。

票数 2
EN
页面原文内容由Server Fault提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://serverfault.com/questions/758100

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档