用户工具

站点工具

本页面的其他翻译:
  • zh

adf:clusterfloating

这是本文档旧的修订版!


如果您希望在集群安装AMS、获取机器信息、申请浮动license、安装license

AMS软件本身并不区分正式版、试用版。对于试用版和正式版的区分,是在license文件,以及法律意义的授权协议上面。因此无论是试用版还是正式版,安装过程都是按照如下步骤:

1,解压

如果是root用户:将安装包上传到在目标文件夹(例如/public/software/,对于集群来说,必须是装在共享目录下面,也就是说在管理节点上安装之后,其他节点也自动有了),并中解压AMS安装包:

cd /public/software/
tar zxf ./adf2019.101.pc64_linux.platform_mpi.bin.tgz (当然不同的版本,这个文件名也不同)

这样会生成文件夹/public/software/adf2019.101

如果是普通用户:安装包上传到在目标文件夹,例如(/home/UserID),并中解压AMS安装包:

cd 
tar zxf ./adf2019.101.pc64_linux.platform_mpi.bin.tgz 

这样会生成文件夹/home/UserID/adf2019.101

2,修改程序的权限

确保ADF2019.101目录对用户具有读、执行权限,如果1,2步是root用户进行解压,则需要执行:

chmod 755 -R /public/software/adf2019.101

如果是普通用户,则跳过即可。

3,设置环境变量

在解压生成的ADF2019.101目录内,有一个文件,名为adfbashrc.sh,用户可以在

export ADFHOME ADFBIN ADFRESOURCES

前面增加一行:

export ADFHOME=/public/software/adf2019.101

说明:

  • 这里的/public/software/adf2019.101即第1步解压产生的目录/public/software/adf2019.101(当然也可以是其它目录,例如:/home/UserID/adf2019.101)

在文件最后增加一行:

export SCM_TMPDIR=/tmp
  • /tmp这个目录要注意经常清理,避免大量垃圾堆积;计算过程中从该目录读取数据的速度,对计算的效率有一定影响,但一般/tmp这个本机目录,速度是很快的;这个目录对AMS用户需要有读写权限。如果设置export SCM_TMPDIR=$PWD,那么临时文件将产生到提交任务的目录。这样在PBS、LSF脚本中最后一行加一句rm -rf kid* t21.*删除掉临时文件即可。
  • 用户可以酌情增加一行环境变量:export SCM_WAIT_LICENSE=9999999999。如果用户提交的作业,所需核数大于购买的核数,那么AMS程序就会等待前面任务完成,再自动运行后面等待的任务,但这个等待时间默认只有600秒,之后就会杀死这个等待的任务。为了与PBS、LSF系统更好的配合,可以将这个等待时间提高到很大,这样只要PBS、LSF没有杀死它,它就一直等待,从而更方便。

4,环境变量如何生效

因此PBS/LSF提交作业的时候,在PBS脚本中增加一句source /public/software/adf2019.101/adfbashrc.sh,具体参考集群、超算:通过PBS、LSF或SLURM脚本提交任务、设定任务核数

如果是SLURM系统,用户可以把这一句写到~/.bashrc文件中,或者由root用户写入/etc/profile文件尾部,之后source ~/.bashrc或source /etc/profile即可。

5,创建浮动目录,获取浮动信息

mkdir /public/software/AMSFloat  (注意,浮动目录可以在用户可以读写执行的任何位置,例如普通用户创建到/home/USERID/AMSFloat也可以)
cd /public/software/AMSFloat
mkdir FloatADF
mkdir FloatBAND      (如果没有购买BAND模块,就不需要创建FloatBAND)
mkdir FloatReaxFF    (如果没有购买ReaxFF模块,就不需要创建FloatReaxFF)
mkdir FloatDFTB      (如果没有购买DFTB模块,就不需要创建FloatDFTB)
chmod 1777 Float*
ls -lid $PWD/Float*

将产生的一行或几行信息的文本收集起来。注意,Float*目录创建之后,不能改动,删除之后原位置重建也不可以。因此,Float*目录没有放在/public/software/adf2019.101下面,这样以后安装其他版本时,就不需要再提供机器信息,license升级版本后可以直接放入使用

6,获取机器信息(用于申请license)

节点信息

在管理节点,以及几个代表性计算节点(代表性节点指节点名字是一系列的,比如一个集群有100个节点,其中20个节点的机器名叫做node1、node2、node3等;另外有30个节点叫做cn01、cn02、cn03等;还有50个节点叫做compute01、compute02、compute03等。那么需要取的机器信息就是管理节点,以及node1~node3、cn01~cn03、compute01~compute03这些节点)分别运行:

source /public/software/adf2019.101/adfrc.sh
dirac info

将这些节点上dirac info命令产生的输出内容,与第5步中产生的信息一起保存为文本文件,作为机器信息

7,提交机器信息

由注册人邮箱将机器信息发送给费米科技(support@fermitech.com.cn或相关人员),用于license的申请。

为保护注册用户权益,其他邮箱发送机器信息,需要抄送给注册人邮箱,并由费米科技向注册人邮箱邮件核实,之后才能正式向SCM申请正式许可。一般提交机器信息之后,1~3工作日内会把license发给您,如果3天仍然没有收到,您可以联系我们查询一下进度。

8,安装license

用户收到license.txt文件之后,将该文件放置在ADF安装文件夹(如ADF2019.101)中,之后即可正常使用。

注意:license文件与机器信息绑定,不能随意更换机器,SCM会发给用户一个1年期的license文件,有效期在license文件中可以看到。如果有机器需要更换,在有效期结束、SCM发放新license的一个月前,可以通知费米科技需要更换机器,并把新的机器信息发给SCM或费米科技,那么SCM将会根据新的机器信息生成license,发给用户。

安装过程中有任何问题,可以发邮件到support@fermitech.com.cn,说明尽量全面的报错的信息,我们将提供有效的协助。

adf/clusterfloating.1555258654.txt.gz · 最后更改: 2019/04/15 00:17 由 liu.jun

© 2014-2022 费米科技(京ICP备14023855号