用户工具

站点工具


adf:checkparampi

差别

这里会显示出您选择的修订版和当前版本之间的差别。

到此差别页面的链接

两侧同时换到之前的修订记录前一修订版
后一修订版
前一修订版
adf:checkparampi [2022/10/10 22:55] liu.junadf:checkparampi [2022/10/12 10:27] (当前版本) liu.jun
行 12: 行 12:
 </code> </code>
  
-  - Scratch directory即临时文件夹,确保它处于本地文件夹,例如/tmp(/tmp一般不是在NFS共享的,在多个节点并行计算时,临时文件将保存在这些节点各自的/tmp文件夹下),千万不要放在/home之类的NFS共享文件夹内(即任何节点下,该文件夹内的文件是一样的,是各个节点共享的)。 +  - Scratch directory即临时文件夹,确保它处于本地文件夹,例如/tmp(/tmp一般不是在NFS共享的,在多个节点并行计算时,临时文件将保存在这些节点各自的/tmp文件夹下),千万不要放在/home之类的NFS共享文件夹内(即任何节点下,该文件夹内的文件是一样的,是各个节点共享的),但管理员应定期清理各个节点下/tmp内的陈旧文件。 
-  - Communication costs MPI_COMM_WORLD,是节点间通信速度,2.958 微秒/条信息,确保不要大于100微秒,否则请联系管理员。 +  - Communication costs MPI_COMM_WORLD,是**节点间**通信速度,2.958 微秒/条信息,确保不要大于100微秒,否则请联系管理员。越接近节点内通信速度,性能越高 
-  - Communication costs for intra-node,是节点内通信速度,一般情况下会远小于节点间通信速度。如果节点间通信速度太慢,建议只进行节点内并行,不要跨节点并行。+  - Communication costs for intra-node,是**节点内**通信速度,一般情况下会远小于节点间通信速度。如果节点间通信速度太慢,建议只进行节点内并行,不要跨节点并行。
  
 计算结束后,翻到out文件的底部: 计算结束后,翻到out文件的底部:
行 26: 行 26:
   - Total cpu time是CPU真正工作的时间,也就是“计算时间”   - Total cpu time是CPU真正工作的时间,也就是“计算时间”
   - Total system time系统内核消耗时间   - Total system time系统内核消耗时间
-  - Total elapsed time通常略大于以上二者之和,如果差值较大,则表示消耗在磁盘读写或网络通信之类的时间太长+  - Total elapsed time通常略大于以上二者之和,如果差值较大,则表示消耗在磁盘读写或网络通信之类的等候时间太长
  
 +检查使用的网络是Ethernet还是InfiniBAND:环境变量中添加export I_MPI_DEBUG=30,则*.out文件正常内容开头会多出来一部分,这部分内容里面如果能搜到verbs或ofa、ofi,则是使用InfiniBAND;如果带tcp字样,则是使用Ethernet。
adf/checkparampi.1665413750.txt.gz · 最后更改: 2022/10/10 22:55 由 liu.jun

© 2014-2022 费米科技(京ICP备14023855号