这是本文档旧的修订版!
Job Manager支持设置设置远程服务器提交任务,该方法的特点是:
从2017版开始,设置使用Job Manager向服务器提交作业变得格外方便。
QuantumATK中支持两种在远程服务器上运行的方式:
+
,选择一个妥善的保存路径,点击Create
生成SSH Key(显示Successfully Generated),下方输入服务器登录的用户名和密码,点击Upload
上传SSH Key这里以PBS为例。
计算资源页面的几个设置都对应了PBS脚本中的一些资源请求和使用的参数,可以参考它自动创建的提交任务的pbs脚本中的内容: 例如: Number of nodes 为 X,Number of cores per nodes 为 Y,对应于PBS脚本中
#PBS -l nodes=X:ppn=Y
Number of MPI processes 为 x,Number of MPI processes per nodes 为 y,对应了PBS脚本中的
…/mpirun -np x -ppn y xxxxx/atkkpython *.py
这个页面的设置按照硬件和计算体系大小的情况来进行设置:
一般来说,一个core对应一个MPI process,所以应满足
但是对于特别大(具体和一个计算节点的可用内存有关)的体系,如果内存有问题,则可能需要设置一个CPU对应一个MPI process,加入一个节点有2个CPU,这时:
更大的体系,甚至可以一个节点对应于一个MPI process,这时
跨节点并行的还要注意网络选择等问题,详细情况参见QuantumATK并行计算。
当有任务提交之后,可能无法编辑服务器设置,需要先将任务从该服务器下删除(不会删除服务器上的任务文件夹和已经下载的数据)。
如果以上设置没有问题,可以尝试提交任务。将作业脚本发送至job manager,选择相应的队列,点击开始按钮即可开始提交计算。 计算一旦开始排队或运行,VNL即可关闭,并断开网络连接。下次连接时,VNL会自动检测作业进度并下载文件。
在提交任务时,用户仍有机会修改每个提交任务的计算设置,方法是:
由于为了防止重名覆盖,Job Manager会在设定的目录下自动为每个作业生成随机的文件夹名称,这为用户手动查找作业目录带来了一定的麻烦。为此,建议在提交任务时,为每个作业添加一个有意义的子目录(如上图中作业队列默认的目录为/home/ddong/atkjobs,提交任务时可以要求job manager创建子目录sic_bandstructures),这样便于管理计算作业的文件夹。
提交任务遇到问题时,需要针对具体问题编辑设置。
提交任务的PBS脚本的详细设置请参考:通过命令行方式手动提交QuantumATK计算。