在我的公司,我们在一个ESXi实例的IO延迟上遇到了一些奇怪的尖峰。
我们花了24小时才弄清楚到底出了什么问题,到目前为止还没有任何线索。
放弃后,我们把所有的磁盘放在一个不同的服务器(HP DL380 G7)中,它的内存要少得多,只有一个6(HT)核( DL 580上的12个),运行正常大约2小时。
我不知道DL380的规格,但这两台服务器都有一个带有BBWC的智能阵列P410i ( DL 580有1GB)
是否有可能有一个(或全部)磁盘失败而没有实际失败?
发布于 2012-06-28 06:52:16
在DL580系统24小时内,您采取了哪些步骤来排除故障?
这两个系统都具有相同的智能阵列P410 RAID控制器。在DL580 G7和DL380 G7上是否配置了相同的缓存平衡?
对于VMWare ESXi本地存储的使用,我会将控制器设置为25%:75%的读:写比率。
现在细节..。请确保查看以下内容:
RAID 6。RAID 6是一个用于混合VM工作负载的糟糕的选择,因此可以考虑这一点。esxtop?根据您的度量方法,这可能是VM级别的问题。发布于 2012-06-28 20:55:13
如果有人遇到了同样的问题:它确实是其中一个磁盘失败了,在我们今天早些时候回来后,我们发现了这四个磁盘中的一个带有琥珀。
在raid控制器发现故障后,一切都恢复正常,在我们切换回原来的服务器后,延迟再次低于10 it。
虽然DL380 G7不认识到它是电容,也不会激活它的缓存,但这是另一个故事。
https://serverfault.com/questions/402923
复制相似问题