在提交了一个COMPSs应用程序之后,我收到了以下错误消息,并且没有执行该应用程序。
MPI_CMD=mpirun -timestamp-output -n 1 -H s00r0
/apps/COMPSs/1.3/Runtime/scripts/user/runcompss
--project=/tmp/1668183.tmpdir/project_1458303603.xml
--resources=/tmp/1668183.tmpdir/resources_1458303603.xml
--uuid=2ed20e6a-9f02-49ff-a71c-e071ce35dacc
/apps/FILESPACE/pycompssfile arg1 arg2 : -n 1 -H s00r0
/apps/COMPSs/1.3/Runtime/scripts/system/adaptors/nio/persistent_worker_starter.sh
/apps/INTEL/mkl/lib/intel64 null
/home/myhome/kmeans_python/src/ true
/tmp/1668183.tmpdir 4 5 5 s00r0-ib0 43001 43000 true 1
/apps/COMPSs/1.3/Runtime/scripts/system/2ed20e6a-9f02-49ff-a71c-e071ce35dacc : -n 1 -H s00r0
/apps/COMPSs/1.3/Runtime/scripts/system/adaptors/nio/persistent_worker_starter.sh
/apps/INTEL/mkl/lib/intel64 null
/home/myhome/kmeans_python/src/ true
/tmp/1668183.tmpdir 4 5 5 s00r0-ib0 43001 43000 true 2
/apps/COMPSs/1.3/Runtime/scripts/system/2ed20e6a-9f02-49ff-a71c-e071ce35dacc
--------------------------------------------------------------------------
All nodes which are allocated for this job are already filled.
--------------------------------------------------------------------------我正在使用COMPSs 1.3。
为什么会发生这种事?
发布于 2016-03-18 14:25:23
您正试图在同一个节点上运行主节点和辅助节点。在具有NIO适配器(默认选项)的集群中,COMPSs 1.3正在使用mpirun在集群的不同节点上生成主进程和工作进程,而集群中安装的mpirun不允许这样做。
解决这一问题的办法如下:
接下来,COMPSs软件发行版将使用派生命令,该命令在必须解决此问题的不同集群资源管理器(如blaunch、srun)中可用。
https://stackoverflow.com/questions/36086344
复制相似问题