关于-t选项在使用qsub提交作业时所做的工作,文档有点不清楚。
http://docs.adaptivecomputing.com/torque/4-0-2/Content/topics/commands/qsub.htm
从文件中:
-t指定作业数组的任务ids。允许单个任务数组。array_request参数是整数id或整数范围。可以在逗号分隔列表中组合多个id或id范围。例子:-t 1-100或-t 1,10,50-100
下面是一个出错的例子,我请求了2个节点,每个节点8个进程,以及一个由16个作业组成的数组。我原本希望它能自然地分布在这两个节点上,但这16个任务却是通过两个以上的节点进行分配的。
$ echo 'hostname' | qsub -q gpu -l nodes=2:ppn=8 -t 1-16
52727[]
$ cat STDIN.o52727-* | sort
gpu-3.local
gpu-3.local
gpu-3.local
gpu-3.local
gpu-5.local
gpu-5.local
gpu-5.local
gpu-5.local
gpu-5.local
gpu-5.local
gpu-7.local
gpu-7.local
gpu-7.local
gpu-7.local
gpu-7.local
gpu-7.local发布于 2016-06-13 23:57:24
我怀疑这并不能完全回答你的问题,但是你到底希望实现什么还不清楚。
使用qsub -t指定数组只会创建单个作业,所有作业都具有相同的主ID。提交指定的方式将创建16个作业,每个作业请求总共16个核心。这种语法只会使同时提交大量作业变得更容易,而不必编写提交循环的脚本。
仅使用Torque (即,不考虑调度程序),可以通过这样的语句将作业强制到特定节点:
qsub -l节点=gpu-node 01:ppn=8+gpu-node02:ppn=8
更高级的调度程序可以给您更大的灵活性(例如,Moab或Maui允许"-l nodes=2:ppn=8,nallocpolicy=exactnode",它在调度时将NODEALLOCATIONPOLICY EXACTNODE应用于作业,并将在两个节点(在本例中为任意两个节点)上各给出8个核)。
https://stackoverflow.com/questions/37777648
复制相似问题