这是本文档旧的修订版!
例如由于断电或队列中作业运行超过分配时间,在收敛之前计算终止的情况可能会发生。也有可能是由在设置的最大迭代步数之内未达到收敛导致的。在这些情况下,您将想要从停止的位置重新启动作业。
为此,QuantumATK 会定期将计算的当前状态保存到检查点文件中。默认设置是每 30 分钟保存一次。检查点文件的名称始终写在日志文件中。
+------------------------------------------------------------------------------+ | Checkpoint Handler | | Filename : /tmp/checkpoint28146777.nc | | Interval : 0.5 h | +------------------------------------------------------------------------------+ |--------------------------------------------------| Calculating Eigenvalues : ================================================== Calculating Density Matrix : ================================================== +------------------------------------------------------------------------------+ | Density Matrix Report DM[U] DM[D] DD | +------------------------------------------------------------------------------+ | 0 Fe [ 0.717 , 0.717 , 0.716 ] 5.39789 2.59547 -0.00664 |
检查点文件的默认位置在由环境变量 TEMP 指定的目录中。如果您在大型集群上运行,则可能无权写入 TEMP 目录,即使您写入了,也可能会在作业完成时自动删除您在此目录创建的任何文件–即使 QuantumATK 计算没有收敛。在这种情况下,重要的是手动指定检查点文件的位置,如在您的 HOME 目录中。