用户工具

站点工具


atk:使用job_manager向服务器上提交作业

使用Job Manager向服务器上提交作业

概述

Job Manager支持设置设置远程服务器提交任务,该方法的特点是:

  • 安全:仅使用SSH端口的加密通信;服务器端无需后台进程,无需单独开放其他端口,有效保障安全性,特别适合公共服务器上部署计算;
  • 简单:支持自动创建任务文件夹和提交脚本,不需要终端登录服务器进行任务提交;
  • 强壮:任务成功提交之后,即可断开与服务器的连接;不必担心网络问题造成的计算中断;无后台进程、数据库等复杂配置,更强壮;
  • 便捷:随时可以联机查看即可查看任务、下载计算结果。

要使用Job Manager直接向服务器提交计算,需要先进行一次远程服务器连接配置。从2017版开始,设置使用Job Manager向服务器提交作业变得格外方便。详情请参见:设置用于计算的远程服务器

提交新计算作业(计算使用 New Calculator)

如果以上设置没有问题,可以尝试提交任务。将作业脚本发送至job manager,选择相应的队列,点击开始按钮即可开始提交计算。 计算一旦开始排队或运行,VNL即可关闭,并断开网络连接。下次连接时,VNL会自动检测作业进度并下载文件。

自定义任务的计算设置

在提交任务时,用户仍有机会修改每个提交任务的计算设置,方法是:

  • 向队列提交任务后不立即点击“开始运行按钮”,此时可以点击 Job Setting 按钮修改计算设置:

  • 在Resource选项卡中可以临时修改此计算任务的计算资源(与上面队列设置类似):

  • 在IO选项中可以设定此计算任务的目录

提示

于为了防止重名覆盖,Job Manager 会在设定的目录下自动为每个作业生成随机的文件夹名称(格式为提交日期和随机字母组合),这为用户手动查找作业目录带来了一定的麻烦。为此,建议在提交任务时,为每个作业添加一个有意义的子目录(如上图中作业队列默认的目录为/home/ddong/atkjobs,提交任务时可以要求job manager 创建子目录 sic_bandstructures),这样便于管理计算作业的文件夹。

提交续算作业(计算使用了Analysis from File)

  • 通常情况下,程序能自动识别Analysis from File,并正确上传相关文件到服务器文件夹,以备计算使用。
  • 但仍建议用户在提交作业后,开始运行作业前,除计算资源、并行设置外,用户还应检查,所需的hdf5文件上传列表:

计算结果的回传

作业成功开始排队或计算后,图形界面端即可关闭、断开。下次打开图形界面时,软件自动连接服务器检查作业状态,如果自动检查或下载数据失败,可以在 Job Manager 中使用 Recover Data 来强制回传结果。必要时终端登录服务器检查作业状态。

问题排除

提交任务遇到问题时,需要针对具体问题编辑设置。

提交任务的PBS脚本的详细设置请参考:通过命令行方式手动提交QuantumATK计算

atk/使用job_manager向服务器上提交作业.txt · 最后更改: 2018/05/11 12:01 由 fermi

© 2014-2020 费米科技(京ICP备14023855号