我们有一个Microsoft故障转移群集,其动态磁盘由管理。今天,sysadmins为Server添加了一个新磁盘,但是卷上的群集大小是错误的,所以我发布了一种快速格式来更改它。
磁盘卷失败,Server组也失败,群集变得没有响应。几分钟后,我设法转到一个被动节点上。
SAN管理员说这是我的错,因为我不应该用Windows格式的applet格式化磁盘,但是我应该使用。
格式操作可以这样使整个集群组离线吗?
来自事件日志:
The cluster resource host subsystem (RHS) stopped unexpectedly.
An attempt will be made to restart it. This is usually due to a
problem in a resource DLL. Please determine which resource DLL is
causing the issue and report the problem to the resource vendor.来自cluster.log
ERR [RCM] rcm::RcmResControl::DoResourceControl:
ERROR_RESOURCE_CALL_TIMED_OUT(5910)' because of 'Control(STORAGE_GET_DISK_INFO_EX)
to resource 'NameOfTheDiskGroup' timed out.'摘录自赛门铁克文件:
注意:在手动创建资源之前,必须使用VEA GUI用NTFS格式化集群共享卷,并将其挂载到要创建资源的节点上。
这是否意味着磁盘不能从Windows格式化?我可不这么看。
为了记录在案,我过去使用Windows格式化了许多磁盘,没有发生任何不好的事情。
发布于 2014-06-11 14:46:04
从共享卷的方式来看,集群节点似乎已经尝试使用它,因此使用VEA GUI将是最好的方法。这在他们的文档中没有提到,但是他们很可能会做一些与Windows不同的事情(即使这只是运行VEA的机器对CSV的临时写锁,这样它就可以格式化卷,告诉节点使用不同的磁盘等等)。
此外,我怀疑更大的问题是:
注意:您必须确保新群集共享卷的选定驱动器号是可用的,并且不会在任何群集节点上使用。
听起来您的磁盘在格式化时正在使用。使用Windows将磁盘格式化为NTFS可能很简单,但是磁盘正在使用,而且您没有使用VEA GUI (可以说可以防止一些问题),这是造成这种情况的原因。
发布于 2014-06-11 15:39:34
是。如果磁盘已配置为Server的依赖项(要使用,磁盘必须是Server资源的依赖项),那么WSFC的工作方式可能导致“失败”,从而导致磁盘资源脱机,并升级到使整个角色脱机。这可能不是它,但这是集群透视图。我从来没有格式化磁盘后,事实,并看到了它的作用。
也可能是因为Symantec/Veritas不是NTFS,所以在配置它的方式上,您把事情搞砸了,磁盘资源在格式化上脱机了。同样,如果配置为Server的资源依赖项,则会升级。
https://serverfault.com/questions/604370
复制相似问题