第一讲化学信息学概述

化学信息学是采用计算机科学和信息学方法及技术解决化学问题[1-3]的一门学科,是涉及化学、数学、计算机科学以及化学应用领域等多学科的交叉
学科,属人工智能范畴。化学信息学方法和技术可用于解决各个领域中的化学问题。所谓化学问题主要
包括:分子设计、合成设计/反应预测、结构确定。
化学信息学方法主要有三大类:基于数据、基于逻辑和基于原理。
具体而言,基于数据即建立对应的数据库系统,并利用数据库系统获取所需的数据和信息。这种方法的特点是只能得到已被数据库系统收录的化学信
息,且只适用于获取已知对象的数据。基于逻辑即充分利用已收集的大量正确的化学实验数据,以及相关的逻辑推理、归纳和演绎的方法,
对已收集的数据进行分析、归纳,从中获取相关的知识、规则和关系,并利用这些规则、知识和对应关系,
对新化合物、合第一讲
化学信息学概述
姚建华
徐雯丽
蒋舒仰
胡静
李佳
中国科学院能量调控材料重点实验室,中国科学院上海有机化学研究
(上海
200032)
技术讲坛
第44卷第3期2019年3月
上海化工
zipa
Shanghai Chemical Industry
编者按语:化学信息学(Chemoinformatics )是一门利用信息学方法和技术解决化学问题的学科。主要有三种方法———基于数据(Data-based ,D )、基于逻辑(Logic-based ,L )和基于原理(Principle-based ,P )
。这三类方法的合理组合使用,将对化学工作者开展相关的研究起到辅助作用,促进化学界的研究方法和工业界的生产方式不断革新。同时它与迅速崛起的高科技关系密切,是绿化学和绿化工的基
础,是联系化学工业为国民经济可持续发展服务的桥梁,是实现化学创新的有效方法之一。化学研究内
容主要包括三大类:分子设计(Molecular Modeling )、合成设计(Synthesis Design )和结构确定
(Structure I 原dentification )
。目前,化学信息学方法和技术已在制药、农药、材料、环保和中药等研究领域显示出其对这些领域发展的促进作用。随着化学信息学方法和技术的发展,它们将在更多的与化学相关的领域显示其
特殊作用。中国科学院上海有机化学研究所研究员姚建华博士领衔的研发团队经过多年的探索,
开展了化学信息学方法与应用方面的研究。主要内容包括:化学信息的采集与集成、信息管理系统设计与开发、
结构与性质的关系研究、
化合物性质、化学反应和化合物谱图预测方法与应用等。建立的化学信息学技术平台已在公共安全、中药研究和农药等领域得到实际应用。
中国科学院上海有机化学研究所在该领域的研究处于全国领先地位。从本期开始,
本刊将连续刊登姚建华博士领衔的团队在该领域的研究成果,在“技术讲坛”栏目以“讲座”的形式刊登相关的“化学信息学及其应用”系列文章,相信该系列文章的发
表可以预见未来化工发展方向,
必将为上海乃至全国化学工业的发展带来积极的推动作用,也会将该领域的研究工作推向学科的最前沿。随着时间的推移,这方面研究工作的推动作用将来会越来越明显。本
刊热盼广大读者在阅读该系列文章后,将其实践应用,并将研究成果及时反馈给本刊编辑部,将相关研究成果撰写文章在本刊发表,希望大家一起交流,以一个崭新的视角,运用高科技、拓展新思路,共同推进化工行业高速发展。
第一作者简介:姚建华1963年生
博士
中国科学院上海有机化学研究所研究员
主要研究方向:化学信息学方法与
应用研究
已发表论文60余篇获软件著作权授权40多项专利授权1项
担任中国化学会计算(机)化学、公共安全化学
专业委员会委员《农药学学报》和《Molecular Informatics 》编委
震惊世界的中国秘方
7··
上海化工第44卷
成路线/反应、结构和谱图进行相应的预测。这种方法的特点是可以处理大批量的数据和大的体系,但它不能从原理上解释预测结果。基于原理即利用相关的理论计算方法计算化合物的能量和相关性质,根据计算结果,实现分子设计、合成设计/反应预测、结构解析及谱图模拟。该方法的特点是可以从原理上解释它们的结果,但不适用于处理大批数据和大的体系。可见,三类方法各有特点,适用于解决不同状态下的化学问题。
一形成与发展
自1946年第一台计算机诞生起,人们就开始关注,如何利用计算机处理各种数据。在化学领域,在
1957年之前,便有相关研究工作的报道[4-5]。随着应用研究的不断深入,计算机在化学领域的应用,从化学研究本身的数据存储、查询和分析,逐步深入到分子设计、合成设计/反应预测、结构确定,即应用于解决化学问题的工作中[2,6-7]。
1998年之前,采用计算机技术开展分子设计、合成设计或结构确定工作,通常以“计算机辅助”作为标识,并未形成专门的一个学科。1998年,布朗(Brown)博士认识到应用信息技术和管理已成为药物发现过程中的一个关键部分,并首次提出了化学信息学的定义:化学信息学可将这些信息资源组合起来,将数据转化为信息,再将信息转化为知识,以便于在确定和优化药物先导方面快速作出较合理的决策[8]。尽管布朗博士基于药物研发领域提出了化学信息学的概念,但随着计算机和信息技术在化学
领域中应用的不断深入,化学信息学的定义经多次完善后,在2003年,它的定义被描述为:应用信息学方法及技术解决化学问题[3]。之后,它的定义继续得到补充和完善:化学信息学是采用计算机科学和信息学方法及技术解决化学问题[1-3]的一门学科,是涉及化学、数学、计算机科学以及化学应用领域等多学科的交叉学科。它的方法和技术可用于解决所有领域中的化学问题。
二化学问题及其解决方法
2003年,以列化学家A.Shani博士发表了一篇题为“化学几乎无处不在”的文章[9]。在该文中,他介绍了化学的作用,以及与化学相关的领域,如生物、医药、生态、材料、地球科学、农业、环境、生物体
内的各种变化等,它们都与化学密不可分。为此,我们可以认为这些领域中的部分问题,本质上是属于化学问题的范畴:分子设计、合成设计/反应预测、结构确定。
三分子设计
分子设计即采用多种技术发现具有特定应用所需特定性质的新化学实体[10]。
应用于分子设计的化学信息学方法主要包括:(1)基于数据,即利用化合物数据库系统,查询化合物的相关信息;(2)基于逻辑,即建立结构与性质关系模型,并基于模型预测化合物的性质;(3)
基于原理,即采用理论计算方法,计算化合物的物理化学参数,并根据计算结果,预测化合物的特定性质。
四合成设计/反应预测
合成设计/反应预测即采用各种方法和技术设计获得某个化合物的合成路线/反应途径。应用于合成设计/反应预测的化学信息学方法主要包括:(1)基于数据,即利用反应数据库系统,查询合成路线/反应途径的相关信息;(2)基于逻辑,即建立反应物生成产物的规则,并基于规则设计预测特定化合物的合成路线/反应途径;(3)基于原理,即采用理论计算方法,计算反应物变成产物所需的能量,相关的电荷及键长等参数,并根据计算结果,推测反应物变成产物的可能性,并解释其反应机理。
五结构确定
结构确定包含两部分工作:(1)结构解析;(2)谱图模拟。结构解析即根据一组谱图推断一组候选化合物。谱图模拟即根据化合物的化学结构获得预测对应的谱图。
应用于结构解析的化学信息学方法主要包括:(1)基于数据,即利用谱图数据库系统,查询被解析的谱图所对应化合物的结构信息;(2)基于逻辑,即建立谱图与化学结构的对应关系,并根据对应关系,预测可能的化合物结构。
应用于谱图模拟的化学信息学方法主要包括:(1)基于数据,即利用化合物数据库系统,查询与指定化合物相关的谱图信息;(2)基于逻辑,即建立结构与谱图关系模型,并基于模型预测化合物的谱图;(3)基于原理,即采用理论计算方法,计算化合物的
8··
第3期上海化工
谱图数据,并根据计算结果,预测化合物对应的谱图。
最后,比较模拟得到的谱图和被解析谱图,如果两张谱图相同,则用于谱图模拟的化合物即为被解析谱图的化合物。
解决三大类化学问题的化学信息学方法有三种,但在实际应用中,通常没有固定的使用模式,需要根据问题的内容制定使用方案。
六化学信息学的研究内容
化学信息学的方法研究主要集中在基于数据和基于逻辑两类。
基于数据的研究工作主要为“建立数据库系统”。通常一个数据库系统的建立包含两个部分内容:(1)数据采集和规范化处理;(2)数据管理系统的设计与开发。具体的研究内容主要包括:(1)应用图论[11]/化学图论[12-13]方法,实现化学结构的存储、分析和运算;(2)数据规范化处理规则的建立;(3)数
据管理系统的数据结构设计、查询算法设计和系统开发,这部分工作属软件工程[14]范畴。
基于逻辑的研究工作主要为“知识发现,建立知识库系统”。对于分子设计和结构确定而言,研究内容主要包括:(1)应用图论/化学图论方法实现化学结构的存储、分析和运算;(2)应用数据分析方法,如回归分析、方差分析、聚类分析、神经网络等[15],实现化合物性质数据的分析;(3)采用统计学和机器学习方法[16-19]研究化合物结构与性质的关系,并建立对应的关系模型。对于合成设计/反应预测而言,研究内容主要包括:(1)应用图论/化学图论方法实现化学反应数据的存储、分析和运算;(2)将图论/化学图论与数据分析方法组合,实现反应物生成产物的规则提取;(3)建立知识库管理系统:知识管理系统的数据结构设计、查询算法设计和系统开发,这部分工作属软件工程范畴。
七总结
从人类学会使用火,就开始了最早的化学实践活动。人类对“炼丹”和“炼金”活动本质的认识,为化学最终成为一门科学积累了素材。随着人类各种生产活动内容的积累,人们总结感性知识,进行化学变化
的理论研究,使化学成为自然科学的一个分支。自从化学成为一门独立的学科后,随着化学研究的不断深入,以及与其他学科的交叉,新的化学分支学科不断产生,现有的分支学科有:有机化学、无机化学、分析化学、高分子化学、物理化学、环境化学、核化学、材料化学、生物化学、元素有机化学、天然有机化学、药物化学和食品化学等。自化学信息学诞生至今,尚未满30年。可见,相较于已有的化学分支学科,化学信息学是一门非常“年轻”的化学分支学科。与其他分支学科不同,它不做实际的化学实验,但它应用计算机科学和信息学技术开展相应的化学研究工作;同时,它将相关的数学方法/算法转化成适用于处理化学信息的方法/算法。
化学信息学方法和技术的应用,将促进化学研究从传统模式(见图1)向现代模式转换(见图2),并可提高解决化学问题的效率,降低盲目性。
图1传统模式
图2
现代模式
参考文献院
[1]Cheminformatics[EB/OL].[2019-02-25].en. /wiki/Cheminformatics.
[2]CHEN Lingran.Chemoinformatics:past,present,
9
··
上海化工第44卷
and future[J].Journal of Chemical Information and Modeling,2006,46:2230-2255.
[3]GASTEIGER J,ENGEL T.Chemoinformatics:a text-
book[M].Weinheim:WILEY-VCH Verlag GmbH&
Co.KgaA,2003:1.
斯凯瑞金童书
[4]Report to Secretary of Commerce by the advisory com-mittee on application of machines to Patent Office op-erations[EB/OL].[2019-02-25].wwwmerce. gov.
[5]DYSON G M,A new notation and edition enumeration system for organic compounds[M].2ed Edition.London:Longmans Green,1949.
[6]ELYASHBERG M E.WILLIAMS A J.Computer-based structure elucidation from spectral data[M]. Springer,2015:4.
[7]COREY E J,CHENG X M.The Logic of Chemical Synthesis[M].New York:Wiley,1995.
[8]BROWN F.Chemoinformatics:what is it and how does it impact drug discovery[J].Annual Reports Medical Chemistry,1998(33):375-384.
[9]International Union of Pure and Applied Chemistry. Compendium of chemical terminology gold book:ver-sion2.3.3[EB/OL].(2014-02-24)[2019-02-25].gold-
/pdf/goldbook.pdf.
[10]SHANI A.Chemistry is(almost)everywhere and in
everything[J].Chem.Edu.Inter.,2003,4(1):AN-2.
[11]BONDY J A,MURTY U S R.Graph theory with
applications[M].New York:Macmillan Publishers
Limited,1976.
[12]WARR W A.Graphics for chemical structures[J].
ACS Symposium Series,1987.
[13]许禄,胡昌玉.应用化学图论[M].北京:科学出版社,
2000.
[14](美)普雷斯曼.软件工程[M].郭肇德,郑少仁,译.
北京:国防工业出版社,1988.
[15]梅长林,范金城.数据分析方法[M].2版.北京:高等
教育出版社,2018.
[16]TUCKER H G.An introduction to probability and
mathematical statistics[M].New York:American Aca-
demic Press,1962.
[17]罗旭.化学统计学[M].北京:科学出版社,2001.
[18]陆文聪,李国正,刘亮,等.化学数据挖掘方法与应用
[M].北京:化学工业出版社,2012.
[19]MICHALSKI R S,BRATKO I.Machine learning and
data mining:methods and applications[M].Chich-
ester:Wiley,1998.
赢创推出用于更高温度范围3D打印应用的
新型聚合物粉末
赢创集团正积极开拓极具吸引力的3D打印市场,并开发了一种新型聚合物粉末。作为旗下聚酰胺6系列的新产品,该粉末适用于更高温度范围的应用需求,进一步扩展了赢创粉末型3D 打印技术高性能材料产品系列。
赢创的新型聚酰胺粉末具有高机械强度以及优异的耐化学性和耐温性。其热变形温度(HDT
如何保持斗争精神B)约为195℃。此外,粉末材料的低吸水率(低于3%)使其脱颖而出,这一特性对3D打印材料的可加工性和打印出的3D组件的尺寸稳定性具有积极影响。
“适用于单个打印机并且能
够应用于更高温度范围的新型、
即用型材料助推3D打印行业向
批量生产迈进了一步。”专注选择
性激光烧结(SLS)的TPM3D中
餐饮业食品卫生管理办法
国技术公司创始人兼董事长
Mark Zhao说道,“我们看到对可
应用于更高温度范围的3D打印
解决方案的需求十分强烈,例如
汽车和电子行业。因此,我们很高
兴与赢创一起推出新型温度稳定
性材料。”
赢创聚酰胺6系列中的新型
聚合物粉末具有近乎圆形的晶粒
形状,优异的流动性和应用性能,
适用于所有粉末型3D打印技
术。赢创的专利工艺被用于其马
尔工厂生产高温材料。
航空动力学报
3D打印市场正在蓬勃发展,
其增长率达到两位数。赢创是聚
酰胺12粉末(PA12)生产的全
球领先者,其生产的PA12已在
增材制造技术领域使用了20多
年。除聚醚醚酮(PEEK)长丝和
PA12粉末外,公司的产品组合
还包括柔性PEBA粉末以及全系
列添加剂,如分散剂、流动改进剂
或反应性改性剂。
(Grace)
10··

本文发布于:2024-09-23 18:32:45,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/262002.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:化学   方法   信息学   应用   研究   设计
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议