我是不是漏掉了一些基本的东西?我的AVG是在线和工作的,但是它所在的集群是离线的。我认为这是不可能的,所以我要么对它的工作方式有一个基本的误解,要么我有一些奇怪的事情发生。我有过
3节点多子网AOAG。2台SQL服务器本地数据中心同步,1台SQL服务器DR异步。
Get-集群资源结果:
Cluster IP Address: Failed
Cluster IP Address XX.XX.XXX.XX Failed (2nd subnet node)
Cluster name: Offline
File Share Witness: Online
Availability Group Name: Online
Availability local IP: Online
Availability 2nd subnet IP: Offline
Availability Group name: Online数据库都是同步的和在线的。可用性组工作正常。我会遇到很多奇怪的崩溃,它们可能相关,也可能不相关(CheckDB经常导致SQL崩溃,尽管这是一个具有8CPU和128 or mem的静态测试集群)。一点关系都没有。更令人困惑的是集群离线但AVG在线。我在prod中也有相同的设置(只有diff是存储),正如预期的那样,在这个集群名称上,本地IP是在线的
发布于 2018-08-14 16:30:11
但是它所在的集群表示脱机。
它不是脱机的,否则clussvc会停止,您的错误日志中会出现错误,即AG由于集群服务的丢失而关闭,并且在继续之前等待集群服务启动。
我相信你所引用的结论是基于:
群集IP地址:失败的群集IP地址XX.XX.XXX.XX失败(第二个子网节点)群集名称:脱机
这只是让您知道集群名称和相关的is不在线。这些是核心集群资源的一部分,但不会停止集群本身,也不会停止其上的大多数服务。实际上,如果您试图使用集群名称(如RSAT)工具远程连接到集群,它应该会失败,但这只是名称解析和管理端点。这不会影响不同资源组中的集群资源,除非出于某种原因,他们使用了这个名称(不过,我不知道为什么)。
数据库都是同步的和在线的。可用性组工作正常。
是的,这是因为集群正在运行,尽管您有一些失败的资源,应该尽早处理。
我应该检查哪些是基本群集运行( AVG正在运行的除外)?
这将进入Windows领域,虽然我没有问题谈论它,但我不确定这是否适合它,所以我将给您一小部分项目入门,以检查WSFC (Windows故障转移群集):
Get-Cluster MyCluster)Get-ClusterResource -Cluster MyCluster)Get-ClusterNode -Cluster MyCluster | Select Name, NodeWeight, DynamicWeight WS2012+)请注意,您不必使用powershell,但这是获取集群资源信息的最简单、最快的方法之一,而无需通过集群API编写自己的调用。
旁白:我不会叫AVG的可用性组,典型的名称是AG或AGs。
https://dba.stackexchange.com/questions/214897
复制相似问题