目录

通过命令行方式手动提交QuantumATK计算

运行串行计算

在Linux单机上安装好并行环境后,可以直接通过交互式命令来并行计算:

atkpython input.py | tee log

在Linux单机上并行计算

在Linux单机上安装好并行环境后,可以直接通过交互式命令来并行计算:

/home/username/mpich-3.0.4/bin/mpirun -np 4 atkpython input.py | tee log

注意

  • 在单机上使用MPI并行可能和MKL的多线程并行互相干扰,降低并行效率。应使用环境变量 MKL_NUM_THREADS=1 MKL_DYNAMIC=FALSE 将动态多线程功能关闭。
  • 2017版本以后,QuantumATK使用内置Intel MPI并行,可更好的管理同时使用MPI多进程和MKL多线程并行,敬请测试。

在Linux计算机集群上并行计算

并行提交脚本设置

以下是一个典型的PBS提交脚本,用户可根据实际情况修改使用。用户应对实际安装的系统进行一些测试计算以得到最佳的运行方案。

atk.pbs
#!/bin/bash
## 下载调试此脚本应将中文注释删去,否则可能会有兼容性问题
##
## 提交任务的名称
#PBS -N atktest
## 根据系统提供的队列名设置(这里是low)
#PBS -q low
## 请求计算资源(示例为请求4个节点,每节点20个核)
#PBS -l nodes=4:ppn=20
## 导出环境变量
#PBS -V
## 将out和err合并输出
#PBS -j oe
 
##---------------------------------------------------------
## 设置输入文件的名称
SCRIPT=atktest.py
##---------------------------------------------------------
 
##修改路径以适配系统
ATK_BIN_DIR=/your/route/to/QuantumWise/VNL-ATK-2014.2/bin/
MPI_DIR=/your/route/to/mpich-3.1.4/
export LD_LIBRARY_PATH=$MPI_DIR/lib:$LD_LIBRARY_PATH
export PATH=$MPI_DIR/bin:$PATH
 
## 通知计算时需要访问的License server所在位置或自动搜索
export QUANTUM_LICENSE_PATH="6200@管理节点主机名或IP"
 
cd $PBS_O_WORKDIR
 
#创建hostfile
cat $PBS_NODEFILE > hostile.$PBS_JOBID
 
echo ------------------------------------------------------
echo 'Job is running on node(s): '
cat hostile.$PBS_JOBID
echo ------------------------------------------------------
echo PBS: qsub is running on $PBS_O_HOST
echo PBS: originating queue is $PBS_O_QUEUE
echo PBS: executing queue is $PBS_QUEUE
echo PBS: execution mode is $PBS_ENVIRONMENT
echo PBS: current home directory is $PBS_O_HOME
echo PBS: working directory is $PBS_O_WORKDIR
echo PBS: job name is $PBS_JOBNAME
echo PBS: job identifier is $PBS_JOBID
echo PBS: PATH = $PBS_O_PATH
echo PBS: node file is $PBS_NODEFILE
echo ------------------------------------------------------
 
#############################################################
## 三种并行方案,使用时选择一种,并去掉相应的“#”
#############################################################
 
## 方案 1: 每计算核心上安排一个MPI进程(适用于小体系计算)
 
## 将启动的MPI进程总数为NP
#NP=$( sort $PBS_NODEFILE | wc -l )
 
## 每个节点上分配的MPI进程数(需要Linux支持bc计算器命令)
#N_PER_NODE=`$( sort $PBS_NODEFILE | wc -l ) / $( sort $PBS_NODEFILE | uniq | wc -l ) |bc`
 
## 关闭MKL的OpenMP线程
#export OMP_NUM_THREADS=1
#export MKL_NUM_THREADS=1
#export MKL_DYNAMIC=FALSE
 
## 方案 2: 每路CPU上安排一个MPI进程,适用于中等体系计算
## 例如:在开头的资源请求行设置4个节点,假设每个节点有二路CPU,则:
 
## 总MPI进程数NP
#NP=8
 
## 每个节点上MPI进程数(每个节点上的CPU数)N_PER_NODE
#N_PER_NODE=2
 
## 默认使用OpenMP
 
## 方案 3: 每个节点一个MPI进程,适用于超大体系计算
 
##  总MPI进程数NP
#NP=$( sort $PBS_NODEFILE | uniq | wc -l )
 
##  每个节点上一个进程
#N_PER_NODE=1
 
##  默认使用OpenMP
 
## 并行计算命令
$MPI_DIR/bin/mpirun -ppn $N_PER_NODE -np $NP -f hostfile.$PBS_JOBID $ATK_BIN_DIR/atkpython $SCRIPT > ${PBS_JOBNAME}.out

正确选择并行网络

目前主流的计算机集群都配备了InfiniBand(IB)高速网络用于节点间并行的高速数据交换,用户应选择IB网络进行并行。

注意

与OpenMPI不同,MPICH和Intel MPI可能不会自动选择IB网络,敬请留意。

说明

以上脚本的修改需要根据具体的集群hosts文件中的主机名规律进行调试。