我对使用StarCluster和SGE还是个新手。我想知道监控“集群性能”的最佳实践是什么,也就是说,确定集群在某个单位时间内可以运行多少特定作业。我熟悉qstat命令,但它只显示每个作业的状态。我想我的用例是提交X个作业,并知道完成所有X个作业需要多长时间。有没有一种简单的开箱即用的方法,或者我必须编写一个scipt才能做到这一点?
现在,我对每个实例都使用Ubuntu 12.04。
非常感谢!
发布于 2014-09-01 02:29:24
这样一来,一个简单的bash脚本加上一个时间命令就足够了。
lines=999
while [ $lines -ne 0 ]; do
sleep 1;
lines=`qstat -u "*" | wc -l`;
done;只要队列不为空,这个脚本就会循环。如果您将脚本称为"queue_watch.sh",则启动作业,然后运行命令
time bash queue_watch.sh这应该就行了。
https://stackoverflow.com/questions/25559001
复制相似问题