在我们的刀片系统c3000 (惠普469499-b21)中,bl460c刀片与sb40c存储刀片合作作为DAS。bl460没有磁盘,存储刀片有4个驱动器配置为raid 10阵列。
储藏室的刀刃上闪烁着红灯。insight显示器上的附件健康摘要在“健康”和“警告”之间交替,表示存储服务器舱中的设备错误。
在iLO日志中,它还在“海湾温度传感器故障”之间交替进行。以及"OK“,如在-all系统中的go状态。我非常担心这一点,尤其是从今天早上开始,刀片服务器未能启动,原因是存储服务器故障,显示设备错误,有时状态降低,直到我拔出它的刀片服务器并将其插入。我在网上没有发现关于iLO日志中所述错误的记录。
我的数据泄露了吗?我计划尽快找到备用的,但我担心灾难很快就会发生。
这是否是一个iLO固件问题,将通过升级得到解决?
如果我成功地提供了一个新的存储刀片,那么仅仅在没有任何配置的情况下将硬盘连接到新的驱动器就足够了吗?还是有什么需要做的?
请注意,我们有另一个blade+storage刀片工作正常,没有显示任何警告或错误。我意识到这很可能是存储刀片本身的硬件故障,因为当将2对设备从海湾1-2切换到5-6时,错误仍然存在于原来的设备上,所以它不是海湾位置或外壳。我的风扇和电源,当然是设置在正确的方式容纳4刀片。
我很抱歉,如果我缺乏重要的细节提供给你,任何你可以分享的东西将是有帮助的!
发布于 2012-03-07 08:56:27
对于有同样问题的人(我怀疑任何人都会经历这种问题),精确的OA错误日志在它们之间重复几秒钟是:
叶片x环境温度传感器fault...state被降解。
刀片X报告正常健康状况。
海湾中的叶片#x状态从退化变为OK。
叶片x环境温度状态是可以的。
惠普在我们唯一的本地惠普合作伙伴的支持是毫无帮助的。谢天谢地,经过几个小时的撞击,我的头撞到了墙上,把每一寸存储刀片的部件都拆掉了,结果却发现,显然是温度传感器的千斤顶在向后移动。男孩,那是一种解脱!看看这张照片,看看我的意思。谢谢大家!

发布于 2012-03-06 16:02:21
如果将磁盘(一起,按顺序排列)移动到另一个SB40单元,则数据是安全的。我怀疑这是存储刀片单元的问题(温度传感器故障)。在在线支援个案经理上调用HP支持或打开一个案例。
https://serverfault.com/questions/366801
复制相似问题