用户工具

站点工具

本页面的其他翻译:
  • zh

atk:使用job_manager向本地计算机上提交作业

这是本文档旧的修订版!


使用Job Manager向本地计算机上提交作业

最新版的 QuantumATK NanoLab 提供了功能灵活的Job Manager,可以配置实现:

  • 作业排队、运行、管理;
  • 管理本地计算机、远程的计算用服务器。

本文介绍在本地计算机上提交计算。

注意

  • 这里本地计算机的含义是“启动NanoLab图形界面的计算机”。
  • 如果需要了解在远程计算机(即 NanoLab 运行的计算机与运行QuantumATK的计算的服务器不同)上,请参考:

本地机计算队列

在安装好QuantumATK时,软件自动创建本地计算队列(Local)。将作业提交到 Local 队列即在本地计算机上进行计算。在Local队列进行计算时,可以手动开始计算:

也可以选择自动开始计算,并设置根据硬件资源情况选择同时可以运行的作业个数:

提交作业数超出时自动排队计算。

设置并提交计算作业

打开一个 project 或者创建一个新的 project,设置一个新的计算脚本。

将此脚本拖动到Job Manager上,选择 local 队列,即跳出作业提交设置,以下是一个典型的并行计算设置:

作业类型

  • Serial(串行):仅使用一个进程运行作业
  • Threading(多线程):QuantumATK可以使用 Intel MKLopenMP 多线程运行计算。
  • MPI并行:对于多数计算计算,我们推荐 MPI 并行,这可以大大提高了计算效率。 新版的QuantumATK内置并行计算支持,可以直接使用。

点击 Add 按钮,计算作业的状态是“pending”,此时点击上方的 Edit 图标,仍然可以编辑作业的设置。

设置完成后,点击上方按钮栏的开始Start the jobs按钮,开始计算。

回到Job Manager,中间栏列出了作业的状态,开始运行时,右侧栏显示计算过程日志。

要终止计算,点击中间栏下方的 Stop execution 按钮。

监控计算作业

Job Manager右侧栏会显示计算过程日志,便于我们监控计算流程是否正常运行。

查看系统负载

在计算过程中查看系统负载和进程情况,可以看到一个atkpython进程运行,但同时有多个核被占用。这表明任务被分解成多个线程分发在不同的核上。

在计算的过程中,可以查看系统的负载,从下图看到,可以看到串行计算仅使用一个CPU核: 尽管计算只使用了一个核,但是计算可能从一个硬件的一个核转移到另一个核。

终止正在进行的计算

要停止正在进行的计算,可以在Job Manager里点击“stop execution of job”。然而,这可能并不会终止正在进行的后台计算。需要用户手动结束进程。

删除队列中的计算作业

使用上方Delete按钮可以删除队列里的作业,正在执行的计算作业请先终止再删除,删除计算作业不会删除任何与作业相关的文件。

atk/使用job_manager向本地计算机上提交作业.1690273707.txt.gz · 最后更改: 2023/07/25 16:28 由 fermi

© 2014-2022 费米科技(京ICP备14023855号