用户工具

站点工具


adf:clusterfloating

差别

这里会显示出您选择的修订版和当前版本之间的差别。

到此差别页面的链接

两侧同时换到之前的修订记录前一修订版
后一修订版
前一修订版
adf:clusterfloating [2019/04/15 00:17] – [3,设置环境变量] liu.junadf:clusterfloating [2023/11/28 23:19] (当前版本) – [节点信息] liu.jun
行 1: 行 1:
-======如果您希望在集群安装AMS、获取机器信息、申请浮动license、安装license====== +======Linux集群浮动许可:安装、获取机器、申请license、安装license====== 
- +AMS软件本身并不区分正式版、试用版。对于试用版和正式版的区分,是在license文件,以及法律意义的授权协议上面。因此无论是试用版还是正式版,安装过程都是按照如下步骤(以2022.103版为例,其他版本类似)。 
-AMS软件本身并不区分正式版、试用版。对于试用版和正式版的区分,是在license文件,以及法律意义的授权协议上面。因此无论是试用版还是正式版,安装过程都是按照如下步骤: +=====第一步,解压软件===== 
- +安装包上传到在目标文件夹,例如(/home/UserID/AMS),并在该目录中解压AMS安装包:
-=====1,解压===== +
- +
-如果是root用户:将安装包上传到在目标文件夹(例如/public/software/,对于集群来说,必须是装在共享目录下面,也就是说在管理节点上安装之后,其他节点也自动有了),并中解压AMS安装包: +
-<code bash> +
-cd /public/software/ +
-tar zxf ./adf2019.101.pc64_linux.platform_mpi.bin.tgz (当然不同的版本,这个文件名也不同) +
-</code> +
-这样会生成文件夹/public/software/adf2019.101 +
- +
-如果是普通用户:安装包上传到在目标文件夹,例如(/home/UserID),并中解压AMS安装包:+
 <code bash> <code bash>
 cd  cd 
-tar zxf ./adf2019.101.pc64_linux.platform_mpi.bin.tgz +tar zxf ./ams2022.103.pc64_linux.intelmpi.bin.tgz 
 </code> </code>
-这样会生成文件夹/home/UserID/adf2019.101+这样会生成文件夹/home/UserID/AMS/ams2022.103。**其中UserID指代具体用户名,下同。**
  
-=====2修改程序的权限===== +=====第二步设置环境变量===== 
-确保ADF2019.101目录对用户具读、执行权限如果1,2步是root用户进行解压,则需要执行: +在解压生成的AMS2022.103目录内,一个文件名为amsbashrc.sh,里面包含了AMS所需的环境变量。用户需要酌情考虑是否将临时文件夹从默认的/tmp更改为其他路径,例如作业当前目录,如果需要则在amsbashrc.sh最后添加一行(或在pbs脚本中source语句后添加一行):
-<code bash> +
-chmod 755 -R /public/software/adf2019.101 +
-</code> +
-如果是普通用户则跳过即可。+
  
-=====3,设置环境变量===== 
-在解压生成的ADF2019.101目录内,有一个文件,名为adfbashrc.sh,用户可以在 
 <code bash> <code bash>
-export ADFHOME ADFBIN ADFRESOURCES+export SCM_TMPDIR=$PWD
 </code> </code>
-前面增加一行: 
-<code bash> 
-export ADFHOME=/public/software/adf2019.101 
-</code> 
-说明: 
-  * 这里的/public/software/adf2019.101即第1步解压产生的目录/public/software/adf2019.101(当然也可以是其它目录,例如:/home/UserID/adf2019.101) 
  
-最后增加一行: +  * SCM_TMPDIR所指向的这个目录,要注意经常清理,避免大量垃圾堆积; 
-<code bash> +  * 该目录最好是高速读写硬盘中,如果用户不清楚,可以使用默认值(/tmp一般就在高速硬盘中); 
-export SCM_TMPDIR=/tmp +  * 这个目录对AMS用户需要有读写权限,当然一般/tmp对所有用户都有读写权限; 
-</code>+  * (购买软无限核license的用户忽略此条)。购买软件核数较少的用户,可以酌情增加一行环境变量:<color blue>export SCM_WAIT_LICENSE=9999999999</color>。如果用户提交的作业,所需核数大于购买的核数,那么AMS程序就会等待前面任务完成,再自动运行后面等待的任务,但这个等待时间默认只有600秒,之后就会杀死这个等待的任务。为了与PBS、LSF系统更好的配合,可以将这个等待时间提高到很大,这样只要PBS、LSF没有杀死它,它就一直等待,从而更方便。
  
-  * /tmp这个目录要注意经常清理,避免大量垃圾堆积;计算过程中从该目录读取数据的速度,对计算的效率有一定影响,但一般/tmp这个本机目录,速度是很快的;这个目录对AMS用户需要有读写权限。如果设置export SCM_TMPDIR=$PWD,那么临时文件将产生到提交任务的目录。这样在PBS、LSF脚本中最后一行加一句rm -rf kid* t21.*删除掉临时文件即可。 
-  * 用户可以酌情增加一行环境变量:<color blue>export SCM_WAIT_LICENSE=9999999999</color>。如果用户提交的作业,所需核数大于购买的核数,那么AMS程序就会等待前面任务完成,再自动运行后面等待的任务,但这个等待时间默认只有600秒,之后就会杀死这个等待的任务。为了与PBS、LSF系统更好的配合,可以将这个等待时间提高到很大,这样只要PBS、LSF没有杀死它,它就一直等待,从而更方便。 
  
-=====4,环境变量何生效===== +**果是ReaxFF用户**还建议增加一行: 
-因此PBS/LSF提交作业的时候在PBS脚本中增加一句source /public/software/adf2019.101/adfbashrc.sh,具体参考[[adf:pbsorlsf]] +<code> 
- +export OMP_NUM_THREADS=1 
-如果是SLURM系统,用户可以把这一句写到~/.bashrc文件中,或者由root用户写入/etc/profile文件尾部,之后source ~/.bashrc或source /etc/profile即可。 +</code> 
-=====5,创建浮动目录,获取浮动信息=====+=====第三步,创建浮动目录,获取浮动信息=====
 <code bash> <code bash>
-mkdir /public/software/AMSFloat  (注意,浮动目录可以在用户可以读写执行的任何位置,例如普通用户创建到/home/USERID/AMSFloat也可以) +mkdir /home/UserID/AMS/AMSFloat  (注意,浮动目录可以在用户可以读写执行的任何位置) 
-cd /public/software/AMSFloat +cd /home/UserID/AMS/AMSFloat 
-mkdir FloatADF+mkdir FloatADF       (如果没有购买ADF模块,就不需要创建FloatADF)
 mkdir FloatBAND      (如果没有购买BAND模块,就不需要创建FloatBAND) mkdir FloatBAND      (如果没有购买BAND模块,就不需要创建FloatBAND)
 mkdir FloatReaxFF    (如果没有购买ReaxFF模块,就不需要创建FloatReaxFF) mkdir FloatReaxFF    (如果没有购买ReaxFF模块,就不需要创建FloatReaxFF)
 mkdir FloatDFTB      (如果没有购买DFTB模块,就不需要创建FloatDFTB) mkdir FloatDFTB      (如果没有购买DFTB模块,就不需要创建FloatDFTB)
 +mkdir FloatMLPot     (如果没有购买MLPot模块,就不需要创建FloatMLPot)
 chmod 1777 Float* chmod 1777 Float*
 ls -lid $PWD/Float* ls -lid $PWD/Float*
 </code> </code>
-将产生的一行或几行信息的文本收集起来。注意,Float*目录创建之后,不能改动,删除之后原位置重建也不可以。<color blue>因此,Float*目录没有放在/public/software/adf2019.101下面,这样以后安装其他版本时,就不需要再提供机器信息,license升级版本后可以直接放入使用</color>+将产生的一行或几行信息的文本收集起来。注意,Float*目录创建之后,**不能改动,删除之后原位置重建也不可以**。<color blue>因此,Float*目录没有放在/home/UserID/AMS/ams2022.103下面,这样以后安装版本时,就不需要再提供机器license可以直接使用</color>
  
-=====6,获取机器信息(用于申请license=====+=====第四步,获取机器码,用于申请license=====
 ====节点信息==== ====节点信息====
-管理节点,以及几个代表性计算节点<color grey>(代表性节点指节点名字是一系列的,比如一个集群有100个节点,其中20个节点的机器名叫做node1、node2、node3等;另外有30个节点叫做cn01、cn02、cn03等;还有50个节点叫做compute01、compute02、compute03等。那么需要取的机器信息就是管理节点,以及node1~node3、cn01~cn03、compute01~compute03这些节点)</color>分别运行:+**登录节点**(提交作业时所在的节点),以及几个**代表性计算节点**<color lightgrey>(代表性节点指节点名字是一系列的,比如一个集群有100个计算节点,分三类命名,其中20个节点叫做node*,30个节点叫做cn*,50个节点叫做compute*,那么需要取的机器就是节点,以及三类计算节点分别任取两台)</color>运行:
  
 <code bash> <code bash>
-source /public/software/adf2019.101/adfrc.sh+source /home/UserID/AMS/ams2022.103/amsbashrc.sh
 dirac info dirac info
 </code> </code>
  
-将这些节点上dirac info命令产生的输出内容,与第5步中产生的信息一起保存为文本文件,作为**机器信息**。 +将这些节点上dirac info命令产生的输出内容,与第步中产生的信息一起保存为文本文件,作为**机器**。
- +
-=====7,提交机器信息===== +
- +
-由注册人邮箱将机器信息发送给费米科技(support@fermitech.com.cn或相关人员),用于license的申请+
  
-为保护注册用户权益其他邮箱发送机器信息,需要抄送给**注册人邮箱**,并由费米科技向**注册人邮箱**邮件核实,之后才能正式向SCM申请正式许可。<color blue>一般提交机器信息之后,1~3工作日内会把license发给您,如果3天仍然没有收到,您可以联系我们查询一下进度。</color>+=====第五步,提交机器码=====
  
 +提交机器码:由注册人邮箱将机器码发送给费米科技(ams@fermitech.com.cn或相关人员),用于license的申请。<color blue>邮件内容中请说明:单位、注册人、申请正式许可还是试用许可。</color>如果不是注册人本人提交,需要抄送给**注册人邮箱**。<color blue>一般提交机器码之后,1~3工作日内会把license发给您,如果3天仍然没有收到,您可以联系我们查询一下进度。</color>
  
-=====8,安装license===== 
  
-用户收到license.txt文件之后将该文件放置在ADF安装文件夹(如ADF2019.101)中,之后即可正常使用。+=====第六步,安装license=====
  
-**注意:**license文件与机器信息绑定,不能随意更换机器,SCM会发给用户一个1年期的license文件,有效期license文件中可以看到如果机器需要更换,**在有效期结束、SCM发放新license的一个月前**,可以通知费米科技需要更换机器并把新机器信息发给SCM或费米科技那么SCM会根据新机器信息生成license发给用户。+用户收到license.txt文件之后将该文件放置AMS安装文件夹(如ams2022.103),之后即正常使用安装过程中任何问题,可以发邮件到ams@fermitech.com.cn说明尽量全面的报错的信息,我们提供有效协助。 
 +=====第七步:如何提交作业===== 
 +PBS/LSF提交作业的时候,source /home/UserID/AMS/ams2022.103/amsbashrc.sh将会添加到PBS/LSF脚本中。如果是SLURM系统,用户可以把source /home/UserID/AMS/ams2022.103/amsbashrc.sh写到~/.bashrc文件最后一行,之后source ~/.bashrc即可提交作业
  
-安装过程中有任何问题,可以发邮件到support@fermitech.com.cn,说明尽量全面的报错的信息,我们将提供有效的协助。+具体参考:[[adf:pbsorlsf]]
adf/clusterfloating.1555258654.txt.gz · 最后更改: 2019/04/15 00:17 由 liu.jun

© 2014-2022 费米科技(京ICP备14023855号