材料基因工程高通量集成计算与数据管理的方法及系统[发明专利]

(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 (43)申请公布日 (21)申请号 201610798431.6
(22)申请日 2016.08.31
(71)申请人 中国科学院计算机网络信息中心
地址 100190 北京市海淀区中关村南四街4
(72)发明人 杨小渝 
(74)专利代理机构 北京轻创知识产权代理有限
公司 11212
代理人 杨立
(51)Int.Cl.
G06F  17/50(2006.01)
(54)发明名称
材料基因工程高通量集成计算与数据管理
的方法及系统
(57)摘要
本发明涉及一种材料基因工程高通量集成
计算与数据管理的方法及系统,该方法包括:获
取大量初始结构;选择第一性原理计算任务;对
初始结构进行高通量筛选,得到有效结构;根据
有效结构和第一性原理计算任务推荐计算参数;
设置计算资源,生成计算资源配置文件,并保存
计算资源配置文件;将有效结构、计算参数和计
算资源配置文件提交到计算集,进行计算和监
控,并自动纠错;计算完成后,对计算结果文件进
行提取或处理,得到计算结果和描述符数据,并
将计算结果和描述符数据保存到第一性原理计
算数据库中,实现了高通量自动流程第一性原理
计算,及数据的自动提取、加工和存取,使用户可
以便捷地开展自动流程高通量第一性原理计算。权利要求书2页  说明书6页  附图3页CN 106372329 A 2017.02.01
C N  106372329
A
1.一种材料基因工程高通量集成计算与数据管理的方法,其特征在于,包括以下步骤:
步骤1,获取大量初始结构,所述初始结构由高通量建模产生,或由用户直接提供,所述初始结构包括:晶体结构、相结构;
步骤2,选择第一性原理计算任务;
步骤3,对所述初始结构进行高通量筛选,得到有效结构;
步骤4,根据所述有效结构和所述第一性原理计算任务推荐计算参数,用户对所述计算参数进行修改和确认,或用户直接上传计算参数,并保存所述计算参数;
步骤5,设置计算资源,生成计算资源配置文件,并保存所述计算资源配置文件;
步骤6,将所述有效结构、所述计算参数和所述计算资源配置文件提交到计算集,进行计算和监控,并自动纠错;
步骤7,计算完成后,得到计算结果文件,并对所述计算结果文件进行提取或处理,得到计算结果和描述符数据,并将所述计算结果和所述描述符数据保存到第一性原理计算数据库中,所述计算结果包括计算资源和计算参数数据,所述描述符数据包括结构和性质数据。
2.根据权利要求1所述的方法,其特征在于,步骤3具体为:
步骤3.1,去除所述初始结构中的等价结构;
步骤3.2,去除所述初始结构中的不合理结构;
步骤3.3,得到有效结构。
3.根据权利要求1所述的方法,其特征在于,步骤6具体为:
检测所述计算是否有误,如果有误,则自动进行纠错,纠错的方式为调整所述计算参数,并重新将修改过的计算参数和所述有效结构、所述计算资源配置文件提交至计算集进行计算。
4.根据权利要求3所述的方法,其特征在于,步骤7具体为:
步骤7.1,计算完成后得到初始计算结果,将所述初始计算结果保存为计算结果文件;
步骤7.2,对所述计算结果文件进行选择后下载,并保存;
步骤7.3,解析所述计算结果文件,生成计算结果报告;
步骤7.4,提取所述计算结果文件中的计算结果和描述符数据,并将所述计算结果和所述描述符数据存储在第一性原理计算数据库中。
5.根据权利要求4所述的方法,其特征在于,对所述计算的检测内容包括:检测是否有报错信息、查看所述计算结果文件是否完整、判断所述计算结果是否收敛。
6.根据权利要求1-5中任一项所述的方法,其特征在于,在步骤7之后,还包括:
步骤8,将所述有效结构和所述描述符数据进行可视化展示。
7.一种材料基因工程高通量集成计算与数据管理的系统,其特征在于,包括:依次连接的获取系统、高通量作业生成系统、文件系统、作业提交与监控系统、纠错系统、数据提取系统和第一性原理计算数据库,其中,
所述获取模块用于获取大量初始结构,所述初始结构通过高通量建模产生,或由用户直接提供,所述初始结构包括:晶体结构、相结构,所述获取模块还用于选择第一性原理计算任务;
所述高通量作业生成系统用于对所述初始结构进行高通量筛选,得到有效结构,还用于根据所述有效结构和所述第一性原理计算任务推荐计算参数,供用户对所述计算参数进
行修改和确认,或接收用户直接上传的计算参数;
所述文件系统用于保存所述计算参数、计算资源配置文件和计算结果文件;
所述作业提交与监控系统用于设置计算资源,并生成计算资源配置文件,还用于将所述有效结构、所述计算参数和所述计算资源配置文件提交到计算集,进行计算和监控;
所述纠错系统用于自动纠错;
所述数据提取系统用于对计算完成后得到的计算结果文件进行提取或处理,得到计算结果和描述符数据;
所述第一性原理计算数据库用于存储所述计算结果和所述描述符数据。
8.根据权利要求7所述的系统,其特征在于,
所述获取系统包括:高通量建模模块、结构输入模块和任务选择列表,所述高通量建模模块用于通过高
通量建模产生大量初始结构,所述结构输入模块用于获取用户输入的初始结构,所述任务选择列表用于选择第一性原理计算任务;
所述高通量作业生成系统包括:高通量筛选模块和参数配置模块,所述高通量筛选模块用于对所述初始结构进行高通量筛选,得到有效结构,所述参数配置模块用于根据所述有效结构和所述第一性原理计算任务推荐计算参数,还用于接收用户直接上传的计算参数;
所述作业提交与监控系统包括:作业调度模块和监控模块,所述作业调度模块用于设置计算资源,并生成计算资源配置文件,还用于将所述有效结构、所述计算参数和所述计算资源配置文件提交到计算集,进行计算,所述监控模块用于对计算过程进行监控;
所述纠错系统具体用于检测所述计算是否有误,如果有误,则自动进行纠错,纠错的方式为调整所述计算参数,并重新将修改过的计算参数和所述有效结构、所述计算资源配置文件提交至计算集进行计算;
所述数据提取系统包括:提取处理模块和报告生成器,所述提取处理模块用于将计算完成后得到的初始计算结果保存为计算结果文件,并对所述计算结果文件进行选择后下载,还用于提取所述计算结果文件中的计算结果和描述符数据,所述报告生成器用于解析所述计算结果文件,生成计算结果报告。
9.根据权利要求7所述的系统,其特征在于,还包括可视化引擎,分别与所述文件系统与所述第一性原理计算数据库连接,用于对所述有效结构和所述描述符数据进行可视化展示。
材料基因工程高通量集成计算与数据管理的方法及系统
技术领域
[0001]本发明涉及新材料研发领域,尤其涉及一种材料基因工程高通量集成计算与数据管理的方法及系统。
背景技术
[0002]目前,利用计算机模拟的方法来研究材料的性质已经成为探索新材料的一种强有力的方式,其中,第一性原理计算已经能够成功且准确地对材料结构和性质进行预测。国际上已经有一些高通量材料计算软件或第一性原理计算数据库,例如Automatic FLOW软件和Materials Project数据库,但其开源程度以及数据的开放程度不高,影响国内用户的使用,并且需要用户自己搭建计算环境。因此,使用起来会有很大的局限性。
[0003]而且,单一的第一性原理计算无法满足大规模作业平行运行和数据集中管理的要求。尽管可以通过写一段脚本程序的方式初步实现批量作业的自动流程,但是需要用户自己编写代码,购买或租用计算
集,搭建计算环境,数据可视化和格式转换、数据抽取和存储,数据的可靠性评价等依然不易实现,尤其是不能实现计算数据的复用和共享。因此,实现高通量第一性原理计算,数据及计算资源的一体化集成式管理,降低用户开展第一性原理计算的门槛,显得尤为迫切。
发明内容
[0004]本发明所要解决的技术问题是针对用户开展第一性原理计算的不便捷,及无法满足大规模作业平行运行和数据集中管理的要求,提供一种材料基因工程高通量集成计算与数据管理的方法及系统。
[0005]本发明解决上述技术问题的一种技术方案如下:
[0006]一种材料基因工程高通量集成计算与数据管理的方法,包括以下步骤:[0007]步骤1,获取大量初始结构,所述初始结构可以由系统根据内置的计算模块进行高通量建模产生,也可以由用户直接提供,所述初始结构包括:晶体结构、相结构;
[0008]步骤2,选择第一性原理计算任务,包括:结构优化、静态计算、磁学性质计算、弹性常数计算(包括应力—应变法、应变—能量法两种方法)、电子态密度、能带结构、跟频率有关的介电函数以及结构预测和筛选,所选择的第一性原理计算任务可以是以上的一个,也可以是多个;
[0009]步骤3,对所述初始结构进行高通量筛选,得到有效结构;
[0010]步骤4,根据所述有效结构和所述第一性原理计算任务推荐计算参数,包括:结构优化参数、平面波截断能、计算方法参数、K点密度以及交换关联泛函参数信息,然后用户对所述计算参数进行修改和确认,或用户也可以选择直接上传计算参数,并保存所述计算参数;
[0011]步骤5,设置计算资源,包括选择计算集、设置计算时长以及所需CPU核数,生成计算资源配置文件,并保存所述计算资源配置文件;
[0012]步骤6,将所述有效结构、所述计算参数和所述计算资源配置文件提交到计算集,进行计算和监控,并自动纠错;
[0013]步骤7,计算完成后,得到计算结果文件,并对所述计算结果文件进行提取或处理,得到计算结果和描述符数据,并将所述计算结果和所述描述符数据保存到第一性原理计算数据库中,所述计算结果包括计算资源和计算参数数据,所述描述符数据包括结构和性质数据。
[0014]本发明的有益效果是:通过筛选大量初始结构,选择第一性原理计算任务,推荐计算参数,提交计算任务并监控,得到计算结果并存储,使用户可以便捷地开展自动流程高通量第一性原理计算。
[0015]在上述技术方案的基础上,本发明还可以做如下改进:
[0016]进一步地,所述系统内置的计算模块包括:支持单个结构建模和性质计算的原胞模块即Unit Cell
模块、单个结构连续掺杂情况的结构筛选和性质计算的掺杂模块即Doping模块、固溶体合金建模以及性质计算的特殊准随机结构模块即SQS模块、批量结构开展能量计算的多结构模块即Batch calculations模块、用于结构表面吸附的表面吸附模块即Surface Adsorption模块、用于支持内部溶解扩散计算的扩散模块即Diffusion模块、以及支持过渡态搜索的过渡态搜索模块即Transition State Search模块。
[0017]采用上述进一步方案的有益效果是:通过系统内置的计算模块,可以根据不同的研究需求提供更多的高通量建模和自动流程计算,帮助用户便捷实现材料理论设计和相关研究。
[0018]进一步地,步骤3具体为:
[0019]步骤3.1,去除所述初始结构中的等价结构;
[0020]步骤3.2,去除所述初始结构中的不合理结构,例如不稳定结构;
[0021]步骤3.3,得到有效结构。
[0022]进一步地,步骤6具体为:
[0023]检测所述计算是否有误,如果有误,则自动进行纠错,纠错的方式为调整所述计算参数,并重新将修改过的计算参数和所述有效结构、所述计算资源配置文件提交至计算集进行计算。
[0024]进一步地,步骤6中,自动纠错的纠错方式具体为:
[0025]检测是否有报错信息,如果有报错信息,根据报错信息的关键字从纠错规则库中确定纠错方案;检测计算结果文件是否完整,如果计算结果文件不完整,检查计算结果文件的中断信息,从纠错规则库中确定纠错方案;判断计算结果是否收敛,如果计算结果不收敛,调整计算收敛精度或调整计算步长,进行纠错,其中,纠错规则库包括计算错误的分类信息和针对错误的纠错方案。
[0026]进一步地,步骤6中,检测模块针对出错文件的自动纠错最大次数为5次,超过5次自动放弃纠错,并返回自动纠错未成功信息给用户。
[0027]进一步地,步骤7具体为:
[0028]步骤7.1,计算完成后得到初始计算结果,将所述初始计算结果保存为计算结果文件;
[0029]步骤7.2,对所述计算结果文件进行选择后下载,并保存;

本文发布于:2024-09-20 22:33:57,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/464096.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:计算   结构   计算结果   模块   数据   高通量   纠错   参数
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议