我正在使用最近构建的Torque/Maui (w/ PBS)来调度具有异构硬件的集群上的作业。硬件由两个由10个节点组成的集合组成,我希望有两个组对其中一个节点具有较高的优先级。例如:
Node set A of 10 nodes has elevated priority for User Group 1
Node set B of 10 nodes has elevated priority for User Group 2我熟悉如何为所有节点完成这一任务,这里记录了这一点:
http://docs.adaptivecomputing.com/maui/5.1.3priorityusage.php
但是,对于在集群子集上设置这种优先级的最佳策略,我并不熟悉。根据我从Maui文档中可以确定的内容,它可以使用节点集或分区来完成,但我不确定这两种方法中的哪一种是正确的,还是所有这些都是另一种策略。
编辑:我更喜欢单一队列,因为它简化了可用性,并使用户能够使用整个集群,尽管在节点集A和B上具有不同的优先级。
提前谢谢你的帮助。
发布于 2016-05-24 21:25:51
按照我的理解,您已经将节点分配与作业优先级混为一谈了。作业优先级决定了Maui将以多快的速度运行一个作业,因为它会在优先级预订队列中获得优先级。这将决定作业相对于合格/空闲队列中的所有其他作业在作业上的约束范围内运行的速度。
这与毛伊决定安排(计划)工作的地方是分开的。处理这类用例的最自然的方法是保留常备。您可以在每一组节点上(通过主机列表、特性或分区)创建预订,然后给予两个组(或每个人)对这两个保留的访问权限,但对组外的每个具有优先访问权限的人应用负面关联。
示例:
SRCFG[rsvA] NODEFEATURES=setA
SRCFG[rsvA] GROUPLIST=group1,ALL-
SRCFG[rsvA] HOSTLIST=ALL
SRCFG[rsvB] NODEFEATURES=setB
SRCFG[rsvB] GROUPLIST=group2,ALL-
SRCFG[rsvB] HOSTLIST=ALL使用这种配置,Maui将创建保留rsvA,仅包括具有"setA“属性/特性的节点,而来自group1的作业将吸引到(即,具有积极亲缘关系)到该保留中的节点。同样,来自group2中用户的作业将流到rsvB中的节点,具有"setB“属性(如节点文件中定义的那样,或在maui.cfg中的NODECFG行中定义)。这种配置在单个队列中运行良好,本质上是用户透明的。
https://stackoverflow.com/questions/37366535
复制相似问题