用户工具

站点工具


atk:使用job_manager向本地计算机上提交作业

差别

这里会显示出您选择的修订版和当前版本之间的差别。

到此差别页面的链接

两侧同时换到之前的修订记录前一修订版
后一修订版
前一修订版
atk:使用job_manager向本地计算机上提交作业 [2023/07/25 15:55] – [本地机计算队列] fermiatk:使用job_manager向本地计算机上提交作业 [2023/07/27 12:09] (当前版本) – [终止正在进行的计算] fermi
行 25: 行 25:
 提交作业数超出时自动排队计算。 提交作业数超出时自动排队计算。
  
-===== 计算作业设置 ===== +===== 设置并提交计算作业 ===== 
-创建一个新的project,设置一个新的计算脚本。+打开一个 project 或者创建一个新的 project,设置一个新的计算脚本。
  
-将此脚本拖动到''Job Manager''上,选择一个local 队列。 +将此脚本拖动到''Job Manager''上,选择 local 队列,即跳出作业提交设置,以下是一并行计算设置
-{{ :atk:jm_1.png?500 |}} +
-计算作业的状态是“pending”点击''Job Settings''图标,可以编辑作业设置。 +
-{{ :atk:jm_2.png?500 |}} +
-''Job Settings''界面主要包括三部分: +
-  * Job Type(作业类) +
-  * Job properties(任务属性) +
-  * MPI settings(MPI并行设置+
  
 +{{ :atk:capture_20230725155709885.jpg?800 |}}
  
-作业类型可选: 
  
-  * ''Serial''(串行):仅使用一个物理核心运行作业 +=== 作业类型 ===
-  * Threading(多线程):QuantumATK可以使用Intel [[https://software.intel.com/en-us/intel-mkl|MKL]] 中的 [[http://openmp.org/wp/|openMP]] 多线程。 +
-  * MPI并行:**对于多数计算计算,我们推荐MPI并行,这可以大大提高了计算效率。** 新版的QuantumATK内置并行计算支持,可以直接使用。+
  
 +  * ''Serial''(串行):仅使用一个进程运行作业
 +  * Threading(多线程):QuantumATK可以使用 Intel [[https://software.intel.com/en-us/intel-mkl|MKL]] 的 [[http://openmp.org/wp/|openMP]] 多线程运行计算。
 +  * MPI并行:**对于多数计算计算,我们推荐 MPI 并行,这可以大大提高了计算效率。** 新版的QuantumATK内置并行计算支持,可以直接使用。
  
-例如提交MPI并行计算时,选择MPI Parallel方式(即在Job Settings中选择Multiprocess parallel),输入合适的进程数: 
  
-{{ :atk:localqueuempirun.png?direct&400 |}} 
  
-点击''OK''设定作业性质+点击 ''Add'' 按钮,计算作业的状态是“pending”,此时点击上方的 Edit 图标,仍然可以编辑作业的设置
  
-回到''Job Manager'',右侧表中列出了所有计算执行的设置细节: +{{ :atk:capture_20230725160032705.jpg?800 |}}
-  * QuantumATK的可执行文件路径; +
-  * Python脚本和log文件的名字; +
-  * 作业模式(mode)为serial,核数(processors)为1,线程数为1,等等。+
  
-{{ :atk:jm_10.png?600 |}}+设置完成后,点击上方按钮栏的开始''Start the jobs''按钮,开始计算。
  
-===== 开始执行计算作业 ===== 
  
-回到''Job Manager'',点击''Run''(运行)图标开始执行计算作业。作业状态从“Pending”到“Running”。 
-{{ :atk:jm_4.png?500 |}} 
  
-===== 查看计算过程和系统负载 =====+回到''Job Manager'',中间栏列出了作业的状态,开始运行时,右侧栏显示计算过程日志。
  
 +{{ :atk:capture_20230725160952623.jpg?600 |}}
  
-计算作业执行过程中 task state不断变化“Finished”。点击LOG图标可以查看作业日志 +要终止计算点击中间栏下方的 ''Stop execution'' 按钮
-{{ :atk:jm_5.png?500 |}} +
-{{ :atk:jm_6.png?500 |}}+
  
-计算过程中查看系统负载和进程情况,可以看到一个atkpython进程运行,但同时有多个核被占用。这表明任务被分解成多个线程分发在不同的核上。 +===== 监控计算作业 =====
-{{ :atk:jm_14.png?450 |}}+
  
-{{ :atk:jm_15.png?450 |}}+Job Manager右侧栏会显示计算过程日志,便于我们监控计算流程是否正常运行。
  
 +==== 查看系统负载 ====
  
-<WRAP center round info 90%> 
-在计算的过程中,可以查看系统的负载,从下图看到,可以看到串行计算仅使用一个CPU核: 
-{{ :atk:jm_8.png?500 |}} 
-尽管计算只使用了一个核,但是计算可能从一个硬件的一个核转移到另一个核。 
-{{ :atk:jm_9.png?500 |}} 
-</WRAP> 
  
-===== 重新提交计算 =====+计算过程中,使用 Windows 下的任务管理器或 Linux 终端的''top''查看系统负载和进程情况。 
 + 
 +{{ :atk:capture_20230727101451911.jpg?800 |}} 
  
-使用“Resubmit”按钮可以重新提交计算脚本。在此之前如果修改了计算脚本,则重新提交计算会应用这些更改。 
-{{ :atk:jm_11.png?500 |}} 
-<WRAP center round info 90%> 
-默认的计算作业类型(Type)为“多线程”(Threaded),如果想选择“Serial”或“Multiprocess parallel”应在启动计算之前。 
-</WRAP> 
  
 ===== 终止正在进行的计算 ===== ===== 终止正在进行的计算 =====
  
-要停止正在进行的计算,可以在Job Manager里点击“stop execution of job”。然而这可能并不会终止正在进行的台计算。需要用户手动束进程+要停止正在进行的计算,可以在Job Manager里点击“stop execution of job”,显示完成,可以再次查看任务管理器或top命令
  
  
 ===== 删除队列中的计算作业 ===== ===== 删除队列中的计算作业 =====
  
-使用“Trash”按钮可以删除队列里的作业,正在执行的计算作业请先终止再删除,删除计算作业不会删除任何与作业相关的文件。 +使用上方''Delete''按钮可以删除队列里的作业,正在执行的计算作业请先终止再删除,删除计算作业不会删除任何与作业相关的文件。
-{{ :atk:jm_12.png?500 |}}+
  
  
atk/使用job_manager向本地计算机上提交作业.1690271748.txt.gz · 最后更改: 2023/07/25 15:55 由 fermi

© 2014-2022 费米科技(京ICP备14023855号