2009年3月23日星期一

qdel 无法删除掉作业的时候

通常来说当mom节点和server节点通讯出现问题的时候,作业删不掉,这有可能是节点机死了,也有可能是网络出现问题,还有可能是节点机pbs_mom进程掉了。对于这种情况,只要把节点机回复正常,就可以删掉了。
还有一类比较顽固,节点都正常,但是这个作业所分配的节点上已经没有作业进程了,而且这个作业的运行时间已经超出最大运行时间了。这个种情况,可以使用如下命令强制删除
qdel -p
非常灵验,不错
下面是这个选项的man解释
-p Forcibly purge the job from the server. This should only be used if a running job will
not exit because its allocated nodes are unreachable. The admin should make every
attempt at resolving the problem on the nodes. If a job’s mother superior recovers after
purging the job, any epilogue scripts may still run. This option is only available to a
batch operator or the batch administrator.

没有评论: