我的客户的HP ProCurve 5412 HP底盘开关有时会重新启动,尽管它通过四个冗余电源供电,并且处于UPS保护之下。
。
机架用不间断电源是带跳台变压器的APC SmartUPS SUA3000XL 208 V。此交换机为整个设施的电话和接入点提供PoE。电池是健康的,最近更换,并有一个充分的充电。
这些闪光灯的作用是重新启动设施中的所有手机,并切断用户与其会话之间的连接。这是破坏性的。
在开关日志中:
Keys: W=Warning I=Information
M=Major D=Debug E=Error
---- Event Log listing: Events Since Boot ----
I 02/17/16 22:26:31 03802 chassis: System Self test started on Master
I 02/17/16 22:26:31 03803 chassis: System Self test completed on Master
I 02/17/16 22:26:35 00061 system: -----------------------------------------
I 02/17/16 22:26:35 00062 system: Mgmt Module 1 went down without saving crash
information
M 02/17/16 22:26:35 03001 system: System reboot due to Power Failure和版本信息:
valley-core# sh version
Image stamp: /ws/swbuildm/rel_orlando_qaoff/code/build/btm(swbuildm_rel_orlando_qaoff_rel_orlando)
Nov 19 2014 15:17:26
K.15.16.0005
335
Boot Image: Secondary多年来,我没有意识到你必须修改这个开关模型上的电源设置,但是这个单元被正确地配置,以利用多个PSU。
valley-core# sh power-over-ethernet
Status and Counters - System Power Status
System Power Status : Full redundancy
PoE Power Status : Full redundancy
Chassis power-over-ethernet:
Total Available Power : 600 W
Total Failover Power : 600 W
Total Redundancy Power : 600 W
Total Used Power : 359 W +/- 6W
Total Remaining Power : 241 W
Internal Power
Main Power
PS (Watts) Status
----- ------------- ---------------------
1 300 POE+ Connected
2 300 POE+ Connected
3 300 POE+ Connected
4 300 POE+ Connected
External Power
EPS1 /Not Connected.
EPS2 /Not Connected.补充PSU资料:
valley-core# sh system power-consumption
Slot Power Usage:
Slot Module Description Current Power
----- ----------------------------------------- ---------------
A HP J9534A 24p Gig-T PoE+ v2 zl Module 18 W
B HP J9536A 20p GT PoE+/2p SFP+ v2 zl Mod 23 W
C HP J9534A 24p Gig-T PoE+ v2 zl Module 18 W
D HP J9534A 24p Gig-T PoE+ v2 zl Module 19 W
E HP J9534A 24p Gig-T PoE+ v2 zl Module 17 W
F HP J9534A 24p Gig-T PoE+ v2 zl Module 18 W
G HP J9534A 24p Gig-T PoE+ v2 zl Module 18 W
H HP J9534A 24p Gig-T PoE+ v2 zl Module 18 W
K HP J9534A 24p Gig-T PoE+ v2 zl Module 18 W
L HP J9534A 24p Gig-T PoE+ v2 zl Module 19 W
valley-core# sh system power-supply
Power Supply Status:
PS# Model State AC/DC + V Wattage
---- --------- ------------- ----------------- ---------
1 Unknwn Powered AC 120V 875
2 Unknwn Powered AC 120V 875
3 Unknwn Powered AC 120V 875
4 Unknwn Powered AC 120V 875
4 / 4 supply bays delivering power.
Total power: 3500 W唯一的特点是开关是唯一失去动力的设备。没有一个连接的服务器有电源问题,尽管是在同一个电池或PDU上。
我可以承认,这个位置的电力是差的,遭受电压下降和偶尔的尖峰。但UPS在最近的暖启动过程中甚至没有记录故障。
我有另一个5412 in在一个无关的客户,已经做了多次相同的事情在过去。
对我能做什么有什么想法吗?我是否应该尝试将两个PSU移到公用电源上,而不是全部安装在UPS上?
编辑:
引导历史显示:
谷核# sh引导历史
Mgmt Module 1 -- Saved Crash Information (most recent first):
=============================================================
ID: 29008d6a
Active system went down: 02/01/16 09:23:54 K.15.16.0005 335
Switch rebooting due to temporary loss of power or low voltage
ID: 994a405a
Active system went down: 12/14/15 11:31:15 K.15.16.0005 335
switch rebooting due to temporary loss of power or low voltage先前固件版本上的HP更改说明如下:
电源(CR_0000112424) -当开关暴露在交流功率波动和电压下降过低时,开关重新启动并产生错误的错误消息,称开关崩溃。通过此修复,错误消息将被更改为“由于暂时失去电源或低压而重新启动开关”。
这与这张技术报告是一致的。
发布于 2016-02-18 13:08:12
我最初的想法和眼前的想法都和你所想的一样。如果这些闪点与您在UPS上设置的任何自测试计划无关(如果在进行自我测试时出现某些百分比的故障,那么您就会遇到UPS/变压器/负载问题),我会按照您的建议来做。将两个PSU移动到不同的提要,并查看是否再次出现闪点。如果他们这么做了--我不是在暗示这一点--就会向惠普提起诉讼。这可能是一个痛苦而乏味的过程。然而,它们可能会帮助提供指导,以获得真正的调试信息的开关。我也会花点时间检查一下最新版本的便笺/程序列表,看看开关上固件的最新版本。
发布于 2016-02-18 17:24:30
根据此页的说法,您的UPS系列属于“线交互”类型。这种指定意味着它不会不断地将公用电源转换为DC,然后再回到主电源级别。相反,它只是坐在那里监视电力和保持电池充电。输入功率直接通过,虽然它可以通过几个扼流圈和一个浪涌保护装置沿途额外的安全。
当公用电源下降或有电压下降时,UPS需要将其逆变器切换到电路中,以便开始向所连接的设备提供电池电源。不管这种切换是如何完成的(它要么是物理继电器,要么是固态继电器),你总是会看到几毫秒的“间隔”。此外,UPS的逆变器可能不会与公用电源同步,因此交流波形跳转到新的相位。
大多数设备并不关心输入电源是否会在几毫秒内丢失。电源中的电容器通常足够大,可以通过小间隙而不出问题。我见过许多服务器和网络设备需要几个完整的错过周期,而没有出现故障。
我怀疑这个特殊的开关的PSU比大多数的PSU都要重要一些。我认为您的问题可以通过获得另一个UPS (它在循环中不断地转换AC-DC-AC)来解决。这种类型的UPS通常被称为“联机”,尽管您应该与您的供应商检查以确认您得到了正确的类型。
发布于 2016-02-18 16:19:37
您刚才在编辑中添加的信息非常清楚。
出现了两个可能的原因:
1)当UPS实际需要工作时,它的输出电压略有下降,并且变化率很高,使开关认为它的功率状况很低。
我以前见过UPS设备也发生过这种情况。
唯一的解决办法是承担一些UPS或获得一个更大的UPS。
在某些情况下:如果UPS有多个输出电路,重新分配这些电路上的负载可能会有所帮助。理想情况下,每个电路或多或少都有相同的负载。这将使输出电压降到最小.
2)另一种可能性,尽管非常罕见,也适用于具有多个输出的UPS单元。考虑到它们所提供的AC的阶段,它可能不是完全同步的输出。
如果你的PSU用相位差连接到几个电路上,开关内部的电源板可能会出现同步问题,导致同样的问题。在这种情况下,解决方案是完全相反的:把所有东西放在同一条线路上。
https://serverfault.com/questions/758100
复制相似问题