我是一个DBA,管理一个主要托管SQL服务器和几个应用服务器的vmware ESX 3.5集群,我有一个关于如何设置资源组的问题,但我与ESX系统管理员之一就如何管理资源发生了冲突。
集群(3个节点,每个节点32 33 )目前承载33名客户,配置为消耗77 33的RAM,尽管ESX报告说只有44 33处于活动状态。集群托管实时、测试、开发服务器和其他几个杂项客户。
我想做的是简化服务器资源的管理,并能够管理和报告相关服务器的性能。
例如,Live服务器、SharePoint服务器、CRM服务器等所消耗的资源(RAM、磁盘、CPU)。
接下来我要做的是创建4个“顶级”资源组。
1-High - For the most mission critical services (ie. the live SQL server)
32768 memory shares
2-Normal - For the majority of the remaining live systems (CRM, Sharepoint etc)
16384 memory shares
3-Dev - Test and development systems
8192 memory shares
4-Low - Non supported servers (no sla, temporary build servers etc)
1024 memory shares我已经将服务器分组为它们自己的“应用程序”资源组(SQL、SQL、CRM Live、CRM Test等),但没有对这些组设置任何明确的资源限制。
然后将“应用程序”组放入适当的“顶级”资源组中。
例如,每个子组有4个来宾,每个1cpu和1GB内存。
1-High 32768 shares
SQL Live 4 guests
2-Normal 16384 shares
CRM Live 4 guests
Sharepoint Live 4 guests
3-Dev 16384 shares
CRM Test 4 guests
SQL Test 4 guests
Sharepoint test 4 guests
4-Low
Remaining cruft 4 guests系统管理员告诉我,"Sharepoint只能得到它所需要的50%资源的28%!“
在我回复他之前,我能否得到一些建议和对我的假设的核实:
你的想法和经验是什么?
发布于 2010-01-13 16:01:31
如果我正确地阅读了这篇文章,那么您对您的环境的正常操作是正确的,但是我不确定在发生争用时,你们中的任何一方是否都是正确的。
如果没有争用(当资源利用率超过80% BTW时开始争用),则共享无效。因此,就您的环境中的正常操作而言,资源组将是化妆品。
当出现争用时,CPU资源将受到限制,就像sysadmin所指出的那样,但是如果您失去了一个主机,这并不一定会发生。
您没有说明是否修改了子资源池上的共享。我假设这些都是正常的。
假设存在争用,但共享工作的方式是每个资源池获得资源的比例,该比例等于其在该级别的共享总量的一部分。对于你的第一个水平,你有58k的股票,所以高池得到大约56%,正常得到28%,发展得到14%,低得到1.7%。在每个池中,子池平等地共享该池的资源,除非您已经在该级别显式地设置了额外的共享,如果您有相同的规则适用,但是池的总数不受影响。
因此,在您的情况下,当争用发生时,系统将获得28%的争用资源的50%,即14%。
您可以通过为每个系统所需的CPU和RAM的绝对最小值分配保留来有所帮助。保留值保证分配给您分配给的系统\资源池,而不是由共享分配的。它们的主要缺点是,如果值太高,集群甚至可能无法尝试重新启动VM,因为无法保证资源。
还请记住,即使您的系统在正常运行时只消耗~44 up,但在启动VM时,100%的内存会得到(简单地)分配。这可以在故障转移期间触发内存争用场景,即使系统在运行时实际上有足够的RAM。这是一件值得关注的事情,而不仅仅是担心太多,但它会在HA重新启动过程中引起问题。
编辑以添加
如果您没有更改单个VM或子资源组的默认共享设置,那么当您将所有VM提升到只有一个单独的子RG并将其直接放置在父级的结构中时,分配给单个VM的资源比例将不会改变。但是,如果有多个子RG和不同数量的VM,那么这是不正确的。
在您的示例中,假设我们在他们的子RG中有您的4个Sharepoint VM,在他们的子组中有2个CRM VM。共享点VM分别为3.5%( 28% / 4)和7% ( 28% /2 50%)。如果现在将它们全部移到父RG并删除空的子RG,那么现在有6个VM共享正常RG可以使用的28%的资源,每个VM都将获得4.7% (28% / 6)的资源。
当然,如果您更改了子资源组或单个VM上的共享,这一切都会发生变化。
发布于 2010-01-13 16:00:20
资源定义只在过度提交的集群中生效。
https://serverfault.com/questions/102314
复制相似问题