我有一个脚本,它必须启动两个独立的进程,并等到其中一个进程完成后再继续。
到目前为止,我已经通过使用if fork pid == 0, exec, else wait创建一个进程来运行它。另一个是使用system和命令行创建的。
现在,我准备在http://en.wikipedia.org/wiki/Platform_LSF (LSF)上运行这类工作对进程的400个迭代,但是我关心的是稳定性。我知道这些过程会崩溃。在这种情况下,我需要一个方法来知道进程何时崩溃,并杀死它的对进程和主脚本。
最初我写了一个看门狗,它有3分钟的监视时间,如果3分钟的不活动时间过去了,它就会杀死进程。然而,这捕获了许多假阳性,因为当LSF暂停两个进程之一时,看门狗认为它们是不活动的。
在LSF,当我发布工作,我可以选择杀死他们。然而,当我杀了一份工作,我到底要杀什么呢?会不会杀死Perl脚本创建的两个进程?还是让他们像僵尸一样跑?
重申一下,
发布于 2015-05-05 13:46:54
监视器应该是创建子进程的监视器。(它也可以启动“主脚本”。)当它们崩溃时,wait会告诉您。
my %children;
my $pid1 = fork();
if (!defined($pid1)) { ... }
if ($pid1) { ... }
++$children{$pid1};
my $pid2 = fork();
if (!defined($pid2)) { ... }
if ($pid2) { ... }
++$children{$pid2};
while (keys(%children)) {
my $pid = wait();
next if !$children{$pid}; # !!!
delete($children{$pid});
if ($? & 0x7F) { ... } # Killed from signal
if ($? >> 8) { ... } # Returned an error
}https://stackoverflow.com/questions/30053001
复制相似问题