在我的HPC上通过pysqa适配器运行pyiron作业时,我遇到了一些问题。我不小心擦除了包含pyiron、projects和resources文件夹的pyiron主目录。我已经从另一个集群中复制了所有三个。我认为唯一会引起问题的是resources文件夹中的sqlite.db文件。以前,我通过适配器运行交互式VASP作业没有任何问题。我猜在删除事件之后发生了什么。
我使用的pyiron版本是: 0.2.17
下面是一个使用Interactive vasp作业的最小示例,我已经尝试过了:
from pyiron import Project
pr = Project('Al-test')
structure = pr.create_structure('Al', 'fcc', 4.05)
pr.remove_jobs(recursive=True)
from pysqa import QueueAdapter
sqa = QueueAdapter(directory='~/pyiron/resources/queues/')
sqa.queue_view
pr.job_table()
job = pr.create_job(pr.job_type.Vasp, 'job_int')
job.structure = structure
job.server.run_mode.interactive = True
job.executable.executable_path = '~/pyiron/resources/vasp/bin/run_vasp_5.4.4_std_mpi.sh'
job.input.incar['NCORE']=4
job.server.queue = 'slurm'
job.server.cores=16
job.server.view_queues()
sqa.get_queue_status()
job.run(run_again=True)错误日志的结尾:
~/pyiron/pyiron/pyiron/base/server/generic.py in queue_id(self, qid)
208 qid (int): queue ID
209 """
--> 210 self._queue_id = int(qid)
211
212 @property
TypeError: int() argument must be a string, a bytes-like object or a number, not 'NoneType'这方面的一些意见/反馈将非常感谢。
谢谢!
发布于 2020-11-23 20:18:45
我们在pyiron 0.3.X中更新了队列系统界面,你可以在这里阅读更多信息:https://pyiron.org/news/releases/2020/09/06/pyiron-0-3-X-HPC-release.html
对于pyiron 0.3.X,我们在readthedocs.org上提供了详细的安装指南:https://pyiron.readthedocs.io/en/latest/source/installation.html#remote-hpc-cluster
所以我强烈建议更新到pyiron 0.3.13。
除此之外,错误消息基本上是说提交不成功。如果导航到作业工作目录job.working_directory,您应该会在该工作目录中找到一个run_queue.sh脚本。这是pyiron用来将作业提交到队列系统的脚本。您可以尝试使用sbatch run_queue.sh手动提交它,如果成功,将打印队列id,否则将显示来自您的排队系统的错误消息。
https://stackoverflow.com/questions/64967185
复制相似问题