这是我的/etc/host文件的快照

卡萨帕是主人,客户是奴隶
我已经成功地完成了
sudo mount -t nfs karpathy:/home/mpiuser/cloud ~/cloud我可以通过ssh client登录到我的客户
我关注过这个博客http://mpitutorial.com/tutorials/running-an-mpi-cluster-within-a-lan/
mpirun -np 5 -hosts karpathy ./cpi输出

mpirun -np 5 -hosts client ./cpi
获取误差
[mpiexec@karpathy] HYDT_dmxu_poll_wait_for_event (./tools/demux/demux_poll.c:77): callback returned error status [mpiexec@karpathy] HYD_pmci_wait_for_completion (./pm/pmiserv/pmiserv_pmci.c:179): error waiting for event [mpiexec@karpathy] main (./ui/mpich/mpiexec.c:397): process manager error waiting for completion
发布于 2016-09-01 12:39:59
我希望你已经找到了解决办法,万一你没有找到,我建议你做几件事。1.通过以下操作禁用两个节点上的防火墙
sudo ufw禁用
‘2.创建一个名为machinefile (或任何您喜欢的)的文件,并将CPU的数量与主机名一起存储在两个节点中。我的机器文件包含:
master:8 slave:4
主机名是主从名,而8和4是每个节点上的CPU数。
mpicc -o文件名filename.cpp
mpirun -np 12 -f机器文件./文件名
12是工序的数目。因为这两个节点都有12个CPU,所以最好在12个进程上划分代码。
https://stackoverflow.com/questions/37629129
复制相似问题