...109887541A】一种靶点蛋白质与小分子结合预测方法及系统【专利】

(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 (43)申请公布日 (21)申请号 201910117693.5
(22)申请日 2019.02.15
(71)申请人 张海平
地址 518055 广东省深圳市南山区西丽深
圳大学城学苑大道1068号
申请人 廖麟卜 魏彦杰 王昊 吴序栎
(72)发明人 张海平 廖麟卜 王昊 魏彦杰 
吴序栎 
(74)专利代理机构 深圳市君胜知识产权代理事
务所(普通合伙) 44268
代理人 王永文 刘文求
(51)Int.Cl.
G16B  20/00(2019.01)
G16B  40/00(2019.01)
(54)发明名称
一种靶点蛋白质与小分子结合预测方法及
系统
(57)摘要
本发明提供了一种靶点蛋白质与小分子结
合预测方法及系统,通过获取待结合蛋白质口袋
和待查询小分子的物理化学特征数据;将所述待
结合蛋白质口袋和待查询小分子的物理化学特
征数据分别转化为口袋向量和小分子向量;将所
述口袋向量和小分子向量作为输入预先设置的
基于深度神经网络的预测模型,得到结合概率的
预测结果。本发明所提供的方法及系统,提取了
相互作用直接相关的活性口袋部分表示蛋白,有
利于去除非相关信息,减少噪音,进而提高准确
性。另外,设计了适合学习向量的神经全连接层
网络模型更容易保留更全的信息,通过向量保留
了蛋白小分子作用的关键信息,但是又不依赖于
蛋白小分子复合物构象,为高速准确预测奠定了
基础。权利要求书2页  说明书12页  附图4页CN 109887541 A 2019.06.14
C N  109887541
A
权 利 要 求 书1/2页CN 109887541 A
1.一种靶点蛋白质与小分子结合预测方法,其特征在于,包括:
获取待结合蛋白质口袋和待查询小分子的物理化学特征数据;
将所述待结合蛋白质口袋和待查询小分子的物理化学特征数据分别转化为口袋向量和小分子向量;
将所述口袋向量和小分子向量作为输入预先设置的基于深度神经网络的预测模型,得到结合概率的预测结果。
2.根据权利要求1所述的靶点蛋白质与小分子结合预测方法,其特征在于,所述方法还包括:
获取蛋白-小分子复合物结构数据,并将所述蛋白-小分子复合物结构数据作为正样本集,以及为每个蛋白随机组合一个所述蛋白-小分子复合物结构中不含有的小分子作为负样本集,对所述预测模型进行训练,并结合输出结果,对预测模型进行参数调整。
3.根据权利要求2所述的靶点蛋白质与小分子结合预测方法,其特征在于,所述对所述预测模型进行训练的步骤还包括:
将所述正样本集和所述负样本集的数据分成训练集、验证集和测试集;
使用所述训练集对预测模型进行训练得到预测模型的参数;
使用所述验证集对所述预测模型进行验证得到优化后的模型参数;
使用测试集对所述预测模型进行测试,得到预测模型的输出结果与真实结果之间的误差值。
4.根据权利要求1-3任一项所述的靶点蛋白质与小分子结合预测方法,其特征在于,所述预测模型为基于密集全连接神经网络构建的预测模型,其输出层的激活函数为线性整流函数。
5.根据权利要求1所述的靶点蛋白质与小分子结合预测方法,其特征在于,所述将所述口袋向量和小分子向量作为输入预先设置的基于深度神经网络的预测模型,得到结合概率的预测结果的步骤包括:
根据预测输出的结合概率值对所述结合蛋白进行概率值排名,以及根据所述概率值排列名次得到小分子最佳结合靶点蛋白。
6.根据权利要求2所述的靶点蛋白质与小分子结合预测方法,其特征在于,所述获取蛋白-小分子复合物结构数据的步骤包括:
提取蛋白-小分子复合物结构中距离小分子一纳米以内的蛋白质氨基酸作为蛋白质口袋,或者利用Fpocket软件提取未知蛋白-小分子复合物结构中潜在的蛋白质口袋并进行打分,并将打分高于预设值的活性口袋作为蛋白质口袋。
7.根据权利要求6所述的靶点蛋白质与小分子结合预测方法,其特征在于,获取蛋白-小分子复合物结构数据的步骤还包括:
将所述蛋白质口袋和小分子的物理化学特征数据分别转化为口袋向量和小分子向量;组成向量化后的蛋白-小分子复合物数据库。
8.一种靶点蛋白质与小分子结合预测系统,其特征在于,包括:
数据获取模块,用于获取待结合蛋白质口袋和待查询小分子的物理化学特征数据;
向量化模块,用于将所述待结合蛋白质口袋和待查询小分子的物理化学特征数据分别转化为口袋向量和小分子向量;
2

本文发布于:2024-09-22 06:46:07,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/401659.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:分子   预测   结合   模型   向量   口袋   蛋白质
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议