药物与靶标的相互作用预测方法、装置及存储介质与流程



1.本公开涉及生物医疗领域,尤其涉及一种药物靶标的相互作用预测方法、装置及存储介质。


背景技术:



2.在新药研发过程中,确定药物与靶标蛋白的相互作用情况是其中的关键步骤。由于药物因子与靶标蛋白种类繁多,通过实验的方式确定药物与靶标蛋白的相互作用的效率很低,难以满足药物研发需求。
3.目前,相关技术通常通过计算机预测药物与靶标蛋白的相互作用情况,然而该方案无法准确提取药物与靶标蛋白的特征信息,导致预测药物与靶标蛋白的相互作用的准确度低下。


技术实现要素:



4.本公开提供一种药物与靶标的相互作用预测方法、装置及存储介质,能够提高预测药物与靶标的相互作用概率的准确度。
5.为达到上述目的,本公开采用如下技术方案:
6.一方面,提供一种药物与靶标的相互作用预测方法,该方法包括:根据药物属性信息确定第一药物关联矩阵;药物属性信息包括多个药物的药物结构相似度、药效团相似度、副作用相似度以及基于基因本体论go通路的相似度中的至少一项;第一药物关联矩阵用于表征每个药物在至少一个药物属性上的特征信息;根据靶标属性信息确定第一靶标关联矩阵;靶标属性信息包括多个靶标的靶标结构相似度以及靶标互作用关系中的至少一项;第一靶标关联矩阵用于表征每个靶标在至少一个靶标属性上的特征信息;根据第一药物关联矩阵和第一靶标关联矩阵预测药物与靶标之间的作用概率。
7.基于上述技术方案,本公开提供了一种药物与靶标的相互作用预测方法,预测装置根据药物属性信息确定第一药物关联矩阵,以及根据属性信息确定第一靶标关联矩阵,从而基于第一药物关联矩阵和第一靶标关联矩阵预测药物与靶标之间的作用概率。由于本公开中的药物属性包括药物结构相似度、药效团相似度、副作用相似度以及基于go通路的相似度中的至少一项,靶标属性信息包括多个靶标的靶标结构相似度以及靶标互作用关系中的至少一项,因此确定出的第一药物关联矩阵能够表征每个药物在至少一个药物属性上的特征信息,第一靶标关联矩阵能够表征每个靶标在至少一个靶标属性上的特征信息。如此一来,本公开能够更加准确地提取药物与靶标的特征信息,进而提高预测药物与靶标之间的相互作用的准确度。
8.在一些实施例中,该方法包括:将药物属性信息以及药物标识向量输入第一图卷积模型中,得到初始药物关联矩阵;初始药物关联矩阵用于表征多个药物在每个药物属性上的特征信息;将初始药物关联矩阵输入第二图卷积模型中,得到第一药物关联矩阵;第二图卷积模型用于根据多个药物属性对于药物的影响程度调整药物的特征信息。
9.在一些实施例中,该方法还包括:获取药物属性向量;药物属性向量包括多个药物的药物结构向量、药效团向量、副作用向量以及靶向基因向量中的至少一项;根据药物属性向量确定药物属性信息。
10.在一些实施例中,该方法还包括:获取第一药物的药物结构向量和第二药物的药物结构向量;第一药物和第二药物为多个药物中的药物;根据第一药物的药物结构向量和第二药物的药物结构向量,确定第一药物和第二药物之间的药物结构相似度。
11.在一些实施例中,该方法还包括:获取第一药物的药效团向量和第二药物的药效团向量;第一药物和第二药物为多个药物中的药物;根据第一药物的药效团向量和第二药物的药效团向量,确定第一药物和第二药物之间的药效团相似度。
12.在一些实施例中,该方法还包括:获取第一药物的副作用向量和第二药物的副作用向量;第一药物和第二药物为多个药物中的药物;根据第一药物的副作用向量和第二药物的副作用向量,确定第一药物和第二药物之间的副作用相似度。
13.在一些实施例中,该方法还包括:获取第一药物的第一作用靶标和第二药物的第二作用靶标;第一药物和第二药物为多个药物中的药物;计算第一作用靶标和第二作用靶标之间的序列相似度;根据第一作用靶标和第二作用靶标之间的序列相似度对第一作用靶标与第二作用靶标进行匹配,得到至少一个作用靶标对;根据至少一个作用靶标对的序列相似度确定第一药物和第二药物之间的基于go通路的相似度。
14.在一些实施例中,该方法包括:确定至少一个作用靶标对中的作用靶标数量与第一作用靶标和第二作用靶标的作用靶标总数量的数量比值;根据至少一个作用靶标对的序列相似度以及数量比值确定第一药物和第二药物之间的基于go通路的相似度。
15.在一些实施例中,该方法包括:将靶标属性信息以及靶标标识向量输入第三图卷积模型中,得到初始靶标关联矩阵;初始靶标关联矩阵用于表征多个靶标在每个靶标属性上的特征信息;将初始靶标关联矩阵输入第四图卷积模型中,得到第一靶标关联矩阵;第四图卷积模型用于根据多个靶标属性对于每个靶标的影响程度调整每个靶标的特征信息。
16.在一些实施例中,该方法还包括:获取第一靶标的靶标序列和第二靶标的靶标序列;第一靶标和第二靶标为多个靶标中的靶标;根据第一靶标的靶标序列和第二靶标的靶标序列,确定第一靶标和第二靶标之间的靶标结构相似度。
17.在一些实施例中,该方法包括:将第一药物关联矩阵和第一靶标关联矩阵输入第一融合模型中,得到药物与靶标之间的作用概率。
18.在一些实施例中,该方法包括:根据第一药物关联矩阵中每个药物在至少一个药物属性上的最大特征值确定第二药物关联矩阵;第一药物关联矩阵包括每个药物在至少一个药物属性上的特征值;根据第一靶标关联矩阵中每个靶标在至少一个靶标属性上的最大特征值确定第二靶标关联矩阵;第一靶标关联矩阵包括每个靶标在至少一个靶标属性上的特征值;将第二药物关联矩阵和第二靶标关联矩阵输入第二融合模型中,得到药物与靶标之间的作用概率。
19.另一方面,提供一种药物与靶标的相互作用预测装置,包括:处理单元,被配置为根据药物属性信息确定第一药物关联矩阵;药物属性信息包括多个药物的药物结构相似度、药效团相似度、副作用相似度以及基于go通路的相似度中的至少一项;第一药物关联矩阵用于表征每个药物在至少一个药物属性上的特征信息;处理单元,还被配置为根据靶标
属性信息确定第一靶标关联矩阵;靶标属性信息包括多个靶标的靶标结构相似度以及靶标互作用关系中的至少一项;第一靶标关联矩阵用于表征每个靶标在至少一个靶标属性上的特征信息;处理单元,还被配置为根据第一药物关联矩阵和第一靶标关联矩阵预测药物与靶标之间的作用概率。
20.在一些实施例中,处理单元,被配置为将药物属性信息以及药物标识向量输入第一图卷积模型中,得到初始药物关联矩阵;初始药物关联矩阵用于表征多个药物在每个药物属性上的特征信息;处理单元,还被配置为将初始药物关联矩阵输入第二图卷积模型中,得到第一药物关联矩阵;第二图卷积模型用于根据多个药物属性对于药物的影响程度调整药物的特征信息。
21.在一些实施例中,获取单元,被配置为获取药物属性向量;药物属性向量包括多个药物的药物结构向量、药效团向量、副作用向量以及靶向基因向量中的至少一项;处理单元,被配置为根据药物属性向量确定药物属性信息。
22.在一些实施例中,获取单元,被配置为获取第一药物的药物结构向量和第二药物的药物结构向量;第一药物和第二药物为多个药物中的药物;处理单元,被配置为根据第一药物的药物结构向量和第二药物的药物结构向量,确定第一药物和第二药物之间的药物结构相似度。
23.在一些实施例中,获取单元,被配置为获取第一药物的药效团向量和第二药物的药效团向量;第一药物和第二药物为多个药物中的药物;处理单元,被配置为根据第一药物的药效团向量和第二药物的药效团向量,确定第一药物和第二药物之间的药效团相似度。
24.在一些实施例中,获取单元,被配置为获取第一药物的副作用向量和第二药物的副作用向量;第一药物和第二药物为多个药物中的药物;处理单元,被配置为根据第一药物的副作用向量和第二药物的副作用向量,确定第一药物和第二药物之间的副作用相似度。
25.在一些实施例中,获取单元,被配置为获取第一药物的第一作用靶标和第二药物的第二作用靶标;第一药物和第二药物为多个药物中的药物;处理单元,被配置为计算第一作用靶标和第二作用靶标之间的序列相似度;处理单元,还被配置为根据第一作用靶标和第二作用靶标之间的序列相似度对第一作用靶标与第二作用靶标进行匹配,得到至少一个作用靶标对;处理单元,还被配置为根据至少一个作用靶标对的序列相似度确定第一药物和第二药物之间的基于go通路的相似度。
26.在一些实施例中,处理单元,被配置为确定至少一个作用靶标对中的作用靶标数量与第一作用靶标和第二作用靶标的作用靶标总数量的数量比值;处理单元,还被配置为根据至少一个作用靶标对的序列相似度以及数量比值确定第一药物和第二药物之间的基于go通路的相似度。
27.在一些实施例中,处理单元,被配置为将靶标属性信息以及靶标标识向量输入第三图卷积模型中,得到初始靶标关联矩阵;初始靶标关联矩阵用于表征多个靶标在每个靶标属性上的特征信息;处理单元,还被配置为将初始靶标关联矩阵输入第四图卷积模型中,得到第一靶标关联矩阵;第四图卷积模型用于根据多个靶标属性对于每个靶标的影响程度调整每个靶标的特征信息。
28.在一些实施例中,获取单元,被配置为获取第一靶标的靶标序列和第二靶标的靶标序列;第一靶标和第二靶标为多个靶标中的靶标;处理单元,被配置为根据第一靶标的靶
标序列和第二靶标的靶标序列,确定第一靶标和第二靶标之间的靶标结构相似度。
29.在一些实施例中,处理单元,被配置为将第一药物关联矩阵和第一靶标关联矩阵输入第一融合模型中,得到药物与靶标之间的作用概率。
30.在一些实施例中,处理单元,被配置为根据第一药物关联矩阵中每个药物在至少一个药物属性上的最大特征值确定第二药物关联矩阵;第一药物关联矩阵包括每个药物在至少一个药物属性上的特征值;处理单元,还被配置为根据第一靶标关联矩阵中每个靶标在至少一个靶标属性上的最大特征值确定第二靶标关联矩阵;第一靶标关联矩阵包括每个靶标在至少一个靶标属性上的特征值;处理单元,还被配置为将第二药物关联矩阵和第二靶标关联矩阵输入第二融合模型中,得到药物与靶标之间的作用概率。
31.再一方面,提供一种非暂态计算机可读存储介质。所述计算机可读存储介质存储有计算机程序指令,所述计算机程序指令在计算机(例如,药物与靶标的相互作用预测装置)上运行时,使得所述计算机执行如上述任一实施例所述的药物与靶标的相互作用预测方法。
32.又一方面,提供一种计算机程序产品。所述计算机程序产品包括计算机程序指令,在计算机(例如,药物与靶标的相互作用预测装置)上执行所述计算机程序指令时,所述计算机程序指令使计算机执行如上述任一实施例所述的药物与靶标的相互作用预测方法。
33.又一方面,提供一种计算机程序。当所述计算机程序在计算机(例如,药物与靶标的相互作用预测装置)上执行时,所述计算机程序使计算机执行如上述任一实施例所述的药物与靶标的相互作用预测方法。
34.又一方面,提供一种药物与靶标的相互作用预测装置,该装置包括:处理器和存储器;存储器用于存储计算机程序或指令,处理器用于运行计算机程序或指令,以实现如上述任一实施例所述的药物与靶标的相互作用预测方法。
35.又一方面,提供一种芯片,芯片包括处理器和通信接口,通信接口和处理器耦合,处理器用于运行计算机程序或指令,以实现如上述任一实施例所述的药物与靶标的相互作用预测方法。
36.示例性的,本公开中提供的芯片还包括存储器,用于存储计算机程序或指令。
37.需要说明的是,上述计算机指令可以全部或者部分存储在计算机可读存储介质上。其中,计算机可读存储介质可以与装置的处理器封装在一起的,也可以与装置的处理器单独封装,本公开对此不作限定。
38.在本公开中,上述药物与靶标的相互作用预测装置的名字对设备或功能模块本身不构成限定,在实际实现中,这些设备或功能模块可以以其他名称出现。只要各个设备或功能模块的功能和本公开类似,属于本公开权利要求及其等同技术的范围之内。
附图说明
39.为了更清楚地说明本公开中的技术方案,下面将对本公开一些实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例的附图,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。此外,以下描述中的附图可以视作示意图,并非对本公开实施例所涉及的产品的实际尺寸、方法的实际流程、信号的实际时序等的限制。
40.图1为根据一些实施例提供的一种药物与靶标的相互作用预测系统的结构图;
41.图2为根据一些实施例提供的一种药物与靶标的相互作用预测方法的流程图;
42.图3为根据一些实施例提供的一种第一药物关联矩阵的结构图;
43.图4为根据一些实施例提供的一种池化操作的流程图;
44.图5为根据一些实施例提供的一种数据融合方法的流程图;
45.图6为根据一些实施例提供的另一种药物与靶标的相互作用预测方法的流程图;
46.图7为根据一些实施例提供的一种第一药物关联矩阵确定方法的流程图;
47.图8为根据一些实施例提供的一种药物属性信息的结构图;
48.图9为根据一些实施例提供的另一种药物与靶标的相互作用预测方法的流程图;
49.图10为根据一些实施例提供的另一种药物与靶标的相互作用预测方法的流程图;
50.图11为根据一些实施例提供的另一种药物与靶标的相互作用预测方法的流程图;
51.图12为根据一些实施例提供的另一种药物与靶标的相互作用预测方法的流程图;
52.图13为根据一些实施例提供的一种药物与靶标的相互作用预测装置的结构图;
53.图14为根据一些实施例提供的另一种药物与靶标的相互作用预测装置的结构图。
具体实施方式
54.下面将结合附图,对本公开一些实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。基于本公开所提供的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本公开保护的范围。
55.除非上下文另有要求,否则,在整个说明书和权利要求书中,术语“包括(comprise)”及其其他形式例如第三人称单数形式“包括(comprises)”和现在分词形式“包括(comprising)”被解释为开放、包含的意思,即为“包含,但不限于”。在说明书的描述中,术语“一个实施例(one embodiment)”、“一些实施例(some embodiments)”、“示例性实施例(exemplary embodiments)”、“示例(example)”、“特定示例(specific example)”或“一些示例(some examples)”等旨在表明与该实施例或示例相关的特定特征、结构、材料或特性包括在本公开的至少一个实施例或示例中。上述术语的示意性表示不一定是指同一实施例或示例。此外,所述的特定特征、结构、材料或特点可以以任何适当方式包括在任何一个或多个实施例或示例中。
56.以下,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本公开实施例的描述中,除非另有说明,“多个”的含义是两个或两个以上。
57.在描述一些实施例时,可能使用了“耦接”和“连接”及其衍伸的表达。例如,描述一些实施例时可能使用了术语“连接”以表明两个或两个以上部件彼此间有直接物理接触或电接触。又如,描述一些实施例时可能使用了术语“耦接”以表明两个或两个以上部件有直接物理接触或电接触。然而,术语“耦接”或“通信耦合(communicatively coupled)”也可能指两个或两个以上部件彼此间并无直接接触,但仍彼此协作或相互作用。这里所公开的实施例并不必然限制于本文内容。
[0058]“a、b和c中的至少一个”与“a、b或c中的至少一个”具有相同含义,均包括以下a、b
和c的组合:仅a,仅b,仅c,a和b的组合,a和c的组合,b和c的组合,及a、b和c的组合。
[0059]“a和/或b”,包括以下三种组合:仅a,仅b,及a和b的组合。
[0060]
如本文中所使用,根据上下文,术语“如果”任选地被解释为意思是“当
……
时”或“在
……
时”或“响应于确定”或“响应于检测到”。类似地,根据上下文,短语“如果确定
……”
或“如果检测到[所陈述的条件或事件]”任选地被解释为是指“在确定
……
时”或“响应于确定
……”
或“在检测到[所陈述的条件或事件]时”或“响应于检测到[所陈述的条件或事件]”。
[0061]
本文中“适用于”或“被配置为”的使用意味着开放和包容性的语言,其不排除适用于或被配置为执行额外任务或步骤的设备。
[0062]
另外,“基于”的使用意味着开放和包容性,因为“基于”一个或多个所述条件或值的过程、步骤、计算或其他动作在实践中可以基于额外条件或超出所述的值。
[0063]
如本文所使用的那样,“约”、“大致”或“近似”包括所阐述的值以及处于特定值的可接受偏差范围内的平均值,其中所述可接受偏差范围如由本领域普通技术人员考虑到正在讨论的测量以及与特定量的测量相关的误差(即,测量系统的局限性)所确定。
[0064]
以下,对本公开实施例涉及的名词进行解释,以方便读者理解。
[0065]
(1)基因本体论(gene ontology,go)
[0066]
基因本体论包括分子功能(molecular function,mf)、细胞组分(cellular component,cc)以及生物过程(biological process,bp)三部分内容组成。
[0067]
分子功能是指单个的基因产物(例如蛋白质和rna)或多个基因产物的复合物在分子水平上的活动。细胞组分是指基因产物在执行功能时所处的细胞结构位置。生物过程是指通过多种分子活动完成的生物学过程。
[0068]
基因本体论中的基本要素有:标识信息(go id)、所属方面(例如上述分子功能、细胞组分或者生物过程)、定义信息以及关联关系。
[0069]
(2)神经网络
[0070]
神经网络(neural networks,nns)也称作人工神经网络(artificial neural networks,anns),是一种模仿动物神经网络行为特征,进行分布式并行信息处理的数学模型算法。神经网络包括深度学习网络,例如卷积神经网络(convolutional neural networks,cnn)、残差网络(residual network,resnet)、长短期记忆网络(long short-term memory,lstm)等。
[0071]
在新药研发过程中,确定药物与靶标蛋白的相互作用情况是其中的关键步骤。由于药物因子与靶标蛋白种类繁多,通过实验的方式确定药物与靶标蛋白的相互作用的效率很低,难以满足药物研发需求。
[0072]
目前,相关技术通常通过计算机预测药物与靶标蛋白的相互作用情况,然而该方案无法准确提取药物与靶标蛋白的特征信息,导致预测药物与靶标蛋白的相互作用的准确度低下。
[0073]
鉴于此,本公开提供了一种药物与靶标的相互作用预测方法,根据药物属性信息确定第一药物关联矩阵,以及根据属性信息确定第一靶标关联矩阵,从而基于第一药物关联矩阵和第一靶标关联矩阵预测药物与靶标之间的作用概率。因此本公开可以基于多个属性维度准确地提取药物的特征信息以及靶标的特征信息,进而提高了预测药物与靶标之间
的相互作用的准确度。
[0074]
下面将结合说明书附图,对本公开实施例的实施方式进行详细描述。
[0075]
图1为根据一些实施例提供的一种药物与靶标的相互作用预测系统10的结构图,如图1所示,该药物与靶标的相互作用预测系统10包括:药物与靶标的相互作用预测装置101(以下简称为预测装置101)与数据服务器102。
[0076]
其中,预测装置101与数据服务器102通过通信链路连接,该通信链路可以为有线通信链路,也可以为无线通信链路,本公开对此不予限制。
[0077]
需要说明的是,上述预测装置101与数据服务器102可以为单独的电子设备,例如服务器。预测装置101与数据服务器102也可以为用于实现预测药物与靶标之间相互作用概率功能的应用程序。
[0078]
或者,预测装置101与数据服务器102也可以为同一个装置内的处理芯片或者功能模块。此时,预测装置101与数据服务器102之间的信息交互为同一个装置中的内部交互。
[0079]
示例性的,数据服务器102包括:处理器,处理器可以是一个通用中央处理器(central processing unit,cpu),微处理器,特定应用集成电路(application-specific integrated circuit,asic),或一个或多个用于控制本公开方案程序执行的集成电路。
[0080]
收发器,收发器可以是使用任何收发器一类的装置,用于与其他设备或通信网络通信,如以太网,无线接入网(radio access network,ran),无线局域网(wireless local area networks,wlan)等。
[0081]
存储器,存储器可以是只读存储器(read-only memory,rom)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,ram)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electrically erasable programmable read-only memory,eeprom)、只读光盘(compact disc read-only memory,cd-rom)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器可以是独立存在,通过通信线路与处理器相连接。存储器也可以和处理器集成在一起。
[0082]
预测装置101被配置为根据药物属性信息确定第一药物关联矩阵。
[0083]
其中,药物属性信息包括多个药物的药物结构相似度、药效团相似度、副作用相似度以及基于go通路的相似度中的至少一项。第一药物关联矩阵用于表征每个药物在至少一个药物属性上的特征信息。
[0084]
需要说明的是,药物结构相似度是指药物之间在化学结构上的相似程度,药效团相似度是指药物之间在药效团组成上的相似程度,副作用相似度是指药物之间存在的副作用的相似程度,基于go通路的相似度是指药物能够作用的靶标的相似程度。
[0085]
预测装置101被配置为根据靶标属性信息确定第一靶标关联矩阵。
[0086]
其中,靶标属性信息包括多个靶标的靶标结构相似度以及靶标互作用关系中的至少一项。第一靶标关联矩阵用于表征每个靶标在至少一个靶标属性上的特征信息。
[0087]
需要说明的是,靶标结构相似度是指靶标之间在化学结构上的相似程度,靶标互作用关系是指靶标之间是否存在相互作用。
[0088]
示例性的,靶标的化学结构可以为一级结构、二级结构、三级结构以及四级结构中的至少一项。其中,一级结构为靶标的氨基酸序列,二级结构为蛋白质经过折叠构成的规则片段,三级结构为蛋白质在二级结构的基础上进一步盘绕折叠产生的特定空间结构。四级结构是指多条肽链相互作用形成的空间结构。
[0089]
预测装置101被配置为根据第一药物关联矩阵和第一靶标关联矩阵预测药物与靶标之间的作用概率。
[0090]
预测装置101还被配置为从数据服务器102获取药物数据与靶标数据,并根据药物数据确定药物属性信息,根据靶标数据确定靶标属性信息。
[0091]
其中,药物数据包括每个药物的药物结构、药效团组成、存在的副作用以及能够作用的靶标。靶标数据包括每个靶标的靶标结构以及靶标互作用关系。
[0092]
数据服务器102被配置为存储药物数据和靶标数据,以及向预测装置101发送药物数据和靶标数据。
[0093]
需要指出的是,本公开各实施例之间可以相互借鉴或参考,例如,相同或相似的步骤,方法实施例、系统实施例和装置实施例之间,均可以相互参考,不予限制。
[0094]
图2为根据一些实施例提供的一种药物与靶标的相互作用预测方法的流程图。如图2所示,该方法包括以下步骤:
[0095]
步骤201、预测装置根据药物属性信息确定第一药物关联矩阵。
[0096]
其中,药物属性信息包括多个药物的药物结构相似度、药效团相似度、副作用相似度以及基于go通路的相似度中的至少一项。第一药物关联矩阵用于表征每个药物在至少一个药物属性上的特征信息。
[0097]
需要说明的是,药物结构相似度是指药物之间在化学结构上的相似程度。药效团相似度是指药物之间在药效团组成上的相似程度。副作用相似度是指药物之间存在的副作用的相似程度。基于go通路的相似度是指药物能够作用的靶标的相似程度。
[0098]
示例性的,药物属性信息可以通过表格或者矩阵的形式表示,例如下表1所示:
[0099]
表1药物结构相似度表
[0100] 药物1药物2
……
药物n药物110.2
……
0.12药物20.21
……
0.01
…………………………
药物n0.120.01
……1[0101]
其中,表1用于表示n个药物之间的药物结构相似度,药物1与药物1之间的药物结构相似度为1,药物1与药物2之间的药物结构相似度为0.2,以此类推。药效团相似度、副作用相似度以及基于go通路的相似度可参考上述药物结构相似度的表示方式,此处不再赘述。n为正整数。
[0102]
示例性的,第一药物关联矩阵中的药物在至少一个药物属性上的特征信息可以通过特征值表示,例如具体的数值,向量,以及更高维度的表示形式。又或者,特征信息还可以通过文本数据表示,例如字符串。本公开对此不作限定。
[0103]
以特征信息为向量为例,如图3所示,第一药物关联矩阵可以为n*k*l的3阶张量(tensor),其中包括n个药物在l个药物属性上的特征信息,该特征信息为k维向量。
[0104]
一种可能的实现方式中,预测装置可以基于神经网络算法,将药物属性信息输入神经网络模型中,得到第一药物关联矩阵。
[0105]
示例性的,该神经网络算法可以为卷积神经网络(例如图卷积神经网络)、长短期记忆(long short term memory,lstm)神经网络。
[0106]
步骤202、预测装置根据靶标属性信息确定第一靶标关联矩阵。
[0107]
其中,靶标属性信息包括多个靶标的靶标结构相似度以及靶标互作用关系中的至少一项。第一靶标关联矩阵用于表征每个靶标在至少一个靶标属性上的特征信息。多个靶标的靶标互作用关系可以由预测装置从string数据库中获取。
[0108]
需要说明的是,靶标结构相似度是指靶标之间在化学结构上的相似程度,靶标互作用关系是指靶标之间是否存在相互作用。
[0109]
示例性的,靶标的化学结构可以为一级结构、二级结构、三级结构以及四级结构中的至少一项。其中,一级结构为靶标的氨基酸序列,二级结构为蛋白质经过折叠构成的规则片段,三级结构为蛋白质在二级结构的基础上进一步盘绕折叠产生的特定空间结构。四级结构是指多条肽链相互作用形成的空间结构。
[0110]
靶标属性信息可以通过表格或者矩阵的形式表示,靶标结构相似度可参考上述步骤201中的药物结构相似度,此处不再赘述。靶标互作用关系如下表2所示:
[0111]
表2靶标互作用关系表
[0112] 靶标1靶标2
……
靶标m靶标101
……
0靶标210
……1…………………………
靶标m01
……0[0113]
其中,表2用于表示m个靶标之间相互作用关系。靶标1与靶标1之间不存在相互作用关系,以“0”表示。靶标1与靶标2之间存在相互作用关系,以“1”表示,以此类推,m为正整数。
[0114]
第一靶标关联矩阵可参考上述步骤201中的第一药物关联矩阵,此处不再赘述。
[0115]
一种可能的实现方式中,预测装置可以基于神经网络算法,将靶标属性信息输入神经网络模型中,得到第一靶标关联矩阵。
[0116]
示例性的,该神经网络算法可以为卷积神经网络(例如图卷积神经网络)、长短期记忆(long short term memory,lstm)神经网络。
[0117]
需要说明的是,上述步骤201与步骤202之间相互独立。步骤201可以在步骤202之前执行,也可以在步骤202之后执行,还可以与步骤202并行执行,图2中仅以步骤201在步骤202之前执行为例对本公开提供的药物与靶标的相互作用预测方法进行说明。本公开对上述步骤的执行顺序并不作限定。
[0118]
步骤203、预测装置根据第一药物关联矩阵和第一靶标关联矩阵预测药物与靶标之间的作用概率。
[0119]
一种可能的实现方式中,预测装置将第一药物关联矩阵和第一靶标关联矩阵输入第一融合模型中,得到药物与靶标之间的作用概率。
[0120]
其中,第一融合模型可以为神经网络模型。第一融合模型用于根据第一权重计算
药物与靶标之间的作用概率。第一权重可根据样本数据训练得到。
[0121]
又一种可能的实现方式中,预测装置对第一药物关联矩阵和第一靶标关联矩阵进行池化操作,得到第二药物关联矩阵和第二靶标关联矩阵,并根据第二药物关联矩阵和第二靶标关联矩阵预测药物与靶标之间的作用概率。
[0122]
其中,池化操作可以为平均池化(average pooling)、最大池化(max pooling)、全局平均池化(global average pooling)、全局最大池化(global max pooling)。
[0123]
如图4所示,第一药物关联矩阵为n*k*l的3阶张量(tensor),其中包括n个药物在l个药物属性上的特征信息,该特征信息为k维向量。预测装置根据第i个药物的第j维上的l个特征值确定出第二药物关联矩阵中第i个药物的第j维上的特征值。例如最大池化可以将第i个药物的第j维上的l个特征值中的最大值作为第二药物关联矩阵中第i个药物的第j维上的特征值。平均池化可以将第i个药物的第j维上的l个特征值的均值作为第二药物关联矩阵中第i个药物的第j维上的特征值。
[0124]
需要说明的是,预测装置通过池化操作可以降低第一药物关联矩阵与第一靶标关联矩阵的维度,同时池化后得到的第二药物关联矩阵能够表征每个药物的综合特征信息,第二靶标关联矩阵能够表征每个靶标的综合特征信息。因此,基于池化操作,预测装置可以准确地提取药物与靶标的特征信息,同时降低预测药物与靶标之间的作用概率的复杂度,提高预测效率。
[0125]
以最大池化为例,作为一种可能的实现方式,预测装置根据第一药物关联矩阵中每个药物在至少一个药物属性上的最大特征值确定第二药物关联矩阵,以及根据第一靶标关联矩阵中每个靶标在至少一个靶标属性上的最大特征值确定第二靶标关联矩阵。预测装置将第二药物关联矩阵和第二靶标关联矩阵输入第二融合模型中,得到药物与靶标之间的作用概率。
[0126]
其中,第一药物关联矩阵包括每个药物在至少一个药物属性上的特征值,第一靶标关联矩阵包括每个靶标在至少一个靶标属性上的特征值。第二融合模型可以为神经网络模型。第二融合模型用于根据第二权重计算药物与靶标之间的作用概率。第二权重可根据样本数据训练得到。
[0127]
基于上述技术方案,本公开提供了一种药物与靶标的相互作用预测方法,预测装置根据药物属性信息确定第一药物关联矩阵,以及根据属性信息确定第一靶标关联矩阵,从而基于第一药物关联矩阵和第一靶标关联矩阵预测药物与靶标之间的作用概率。由于本公开中的药物属性包括药物结构相似度、药效团相似度、副作用相似度以及基于go通路的相似度中的至少一项,靶标属性信息包括多个靶标的靶标结构相似度以及靶标互作用关系中的至少一项,因此确定出的第一药物关联矩阵能够表征每个药物在至少一个药物属性上的特征信息,第一靶标关联矩阵能够表征每个靶标在至少一个靶标属性上的特征信息。如此一来,本公开能够更加准确地提取药物与靶标的特征信息,进而提高预测药物与靶标之间的相互作用的准确度。
[0128]
以下以神经网络模型为例,对上述预测装置预测药物与靶标之间的作用概率的过程进行说明:
[0129]
如图5所示,预测装置分别将药物关联矩阵与靶标关联矩阵输入融合模型中,通过权重计算以及激活函数映射后得到药物与靶标之间的作用概率。
[0130]
其中,药物关联矩阵可以为上述第一药物关联矩阵或者第二药物关联矩阵,靶标关联矩阵可以为上述第一靶标关联矩阵或者第二靶标关联矩阵。融合模型可以为上述第一融合模型或者第二融合模型。权重系数可根据样本数据通过模型训练确定,本公开对此不作详述。
[0131]
示例性的,药物关联矩阵yd为n*k维的2阶张量,即yd∈rn·k。靶标关联矩阵y
p
为n*k维的2阶张量,即y
p
∈rm·k。k为正整数。
[0132]
药物与靶标之间的作用概率满足以下公式1:
[0133]
p=σ(ydw
‘yp
t)
ꢀꢀꢀ
公式1
[0134]
其中,p为n个药物与m个靶标之间的作用概率,p∈rn·m。σ()为激活函数(例如sigmoid函数),yd为药物关联矩阵,y
pt
为靶标关联矩阵的转置矩阵,w

为融合模型中的权重系数,w

∈rk·k。
[0135]
以下,结合上述步骤201,对预测装置确定第一药物关联矩阵的过程进行介绍。
[0136]
作为本公开的一种可能的实施例,结合图2,如图6所示,上述步骤201可以通过以下步骤601-步骤602实现:
[0137]
步骤601、预测装置将药物属性信息以及药物标识向量输入第一图卷积模型中,得到初始药物关联矩阵。
[0138]
其中,初始药物关联矩阵用于表征多个药物在每个药物属性上的特征信息。药物标识向量用于标识多个药物中的每个药物。
[0139]
示例性的,药物标识向量可以包括多个药物中每个药物的药物结构向量。该药物结构向量用于表征对应药物的药物结构。该药物结构即为药物的二元化学结构,例如符合smiles标准的881维的向量。
[0140]
如下表3所示,为药物结构向量中的位置与结构类型的对应关系表。
[0141]
表3药物结构向量位置与结构类型的对应关系表
[0142]
药物结构向量位置结构类型0》=4h1》=8h
…………
284c-c
…………
425p=o
…………
880brc1c(br)ccc1
[0143]
其中,药物的二元化学结构包括881种结构类型,分别对应药物结构向量中的881维的向量位置。当药物的药物结构中存在某一结构类型时,则该结构类型的对应向量位置上为该结构类型的数量。例如当药物包括3个“》=4h”的结构类型时,该药物对应的药物结构向量中向量位置“0”处的数值为“3”。
[0144]
或者,通过“1”表示药物的药物结构中存在该向量位置对应的结构类型,通过“0”表示药物的药物结构中不存在该向量位置对应的结构类型。例如当药物存在“》=4h”的结构类型时,该药物对应的药物结构向量中向量位置“0”处的数值为“1”。当药物不存在“》=
8h”的结构类型时,该药物对应的药物结构向量中向量位置“1”处的数值为“0”。
[0145]
以药物acamprosate为例,该药物按照smiles标准的的化学结构式为:cc(=o)ncccs(=o)(=o)o,则该药物对应的药物结构向量为1100000001100010
……
00000000。
[0146]
第一图卷积模型用于根据药物标识向量以及药物属性信息确定药物在每个药物属性上的特征信息。
[0147]
上述步骤601也称作图内卷积操作。如图7所示,预测装置将多个药物之间的l个药物属性信息(即图内邻接矩阵)以及药物标识向量(图7中未示出)作为输入数据,输入第一图卷积模型中进行图内卷积,得到初始药物关联矩阵(图7中未示出)。
[0148]
示例性的,初始药物关联矩阵满足以下公式2:
[0149]
y0=d-1/2
ad-1/2
h0w0ꢀꢀꢀ
公式2
[0150]
其中,y0为初始药物关联矩阵,a为药物属性信息(即图内邻接矩阵),d为药物属性信息的度矩阵,h0为药物标识向量,w0为第一图卷积模型中的权重系数。
[0151]
上述各个参数所属数域分别为y0∈r
l
·k·n,a∈rn·n·
l
,d∈rn·n·
l
,h0∈rn·i·
l
,w0∈ri·k·
l
。l为药物属性信息的数量,n为药物数量,k为维度参数,i为药物标识向量中药物结构向量的长度。
[0152]
例如药物属性信息包括多个药物的药物结构相似度、药效团相似度、副作用相似度以及基于go通路的相似度,则l为4,药物的药物结构向量为881维的向量,则i为881,k可根据实际情况设置。权重系数w0可根据样本数据通过模型训练确定,本公开对此不作详述。
[0153]
基于上述过程,由于药物属性信息包括多个药物在该药物属性上的关联关系,因此预测装置可以分别根据每个药物属性信息对药物标识向量进行调整,从而确定多个药物分别在每个药物属性上的特征信息。也即是说,步骤601用于针对每个药物属性,确定多个药物分别在该药物属性上的特征信息。
[0154]
如图8所示,药物属性包括3个,即l为3,药物数量为4,图中实线相连接的节点连接关系用于表示药物之间在其中一个药物属性上的药物属性信息。以其中药物属性1为药物结构相似度为例,每个节点表示药物自身与自身的药物结构相似度,药物1与药物2的连线表示药物1与药物2之间的药物结构相似度,以此类推。
[0155]
如此一来,预测装置可以根据药物属性1中4个药物之间的药物属性信息计算该4个药物在药物属性1上的特征信息,根据药物属性2中4个药物之间的药物属性信息计算该4个药物在药物属性2上的特征信息,根据药物属性3中4个药物之间的药物属性信息计算该4个药物在药物属性3上的特征信息。
[0156]
步骤602、预测装置将初始药物关联矩阵输入第二图卷积模型中,得到第一药物关联矩阵。
[0157]
其中,第二图卷积模型用于根据多个药物属性对于药物的影响程度调整药物的特征信息。
[0158]
上述步骤602也称作图间卷积操作。如图7所示,预测装置将上述步骤601中确定出的初始药物关联矩阵输入第二图卷积模型中进行图间卷积,即通过图间邻接矩阵将同一个药物在多个药物属性上的特征信息相连接,并通过第二图卷积模型中的权重系数以及激活函数调整相连接的特征信息,从而得到第一药物关联矩阵。
[0159]
示例性的,第一药物关联矩阵满足以下公式3:
[0160][0161]
其中,为第一药物关联矩阵,为图间邻接矩阵,为图间邻接矩阵的度矩阵,y0为初始药物关联矩阵,为第二图卷积模型中的权重系数,σ()为激活函数(例如relu激活函数)。
[0162]
上述各个参数所属数域分别为y0∈r
l
·k·n,l为药物属性信息的数量,n为药物数量,k为维度参数。权重系数可根据样本数据通过模型训练确定,本公开对此不作详述。
[0163]
需要说明的是,为数值均为1的矩阵,用于连接同一个药物在多个药物属性上的特征信息。此时,该药物的多个药物属性之间均存在关联关系。本公开还可以通过“0”表示两个药物属性之间不存在关联关系。具体可根据实际情况设置,本公开对此不作限定。
[0164]
基于上述过程,预测装置可以通过图间邻接矩阵将同一个药物在多个药物属性上的特征信息相连接,并基于权重系数针对每个药物,调整该药物在多个药物属性上的特征信息。
[0165]
针对每个药物,多个药物属性对于药物的影响程度并不相同,例如药物1中副作用的影响程度较高,而药效团的影响程度较低。药物2中副作用的影响程度较低,而药效团的影响程度较高。这就导致基于多种药物在同一个药物属性上的关联关系确定出的多个药物的特征信息无法准确地表征该多个药物的实际信息。
[0166]
而本公开中预测装置在确定第一药物关联矩阵时,可以建立同一个药物在不同药物属性上特征信息的连接关系,基于多个药物属性对该药物的影响程度调节药物的特征信息,以使得所提取的药物的特征信息更加准确。
[0167]
如图8所示,药物属性包括3个,即l为3,药物数量为4,图中虚线相连接的节点连接关系用于表示同一个药物在不同药物属性上的关联关系。以其中药物属性1为例,药物属性1中的药物1与药物属性2中的药物1、药物属性3中的药物1相连接,表示对于药物1来说,药物属性1、药物属性2以及药物属性3之间均存在关联关系。
[0168]
如此一来,预测装置可以根据3个药物属性对每个药物的影响程度,调整药物在3个药物属性上的特征信息。
[0169]
基于上述技术方案,本公开中的预测装置可以先通过多个药物在同一个药物属性上的药物属性信息以及药物标识向量,执行图内卷积操作,得到初始药物关联矩阵。该初始药物关联矩阵用于表征每个药物属性上,多个药物的特征信息。之后,预测装置可以针对初始药物关联矩阵执行图间卷积操作,即根据多个药物属性对于每个药物的影响程度调整每个药物的特征信息,以使得所提取的药物的特征信息更加准确。
[0170]
需要说明的是,本公开中预测装置可以多次执行上述步骤601-步骤602以提取药物的深层次的特征信息。例如图内卷积-图间卷积-图内卷积-图间卷积。其中,第二次图内卷积所输入的数据h0为第一次图间卷积中输出的矩阵第二次图间卷积以及第二次图内卷积的实现方式可参考上述步骤601-步骤602,本公开对此不作赘述。
[0171]
以下,结合上述步骤202,对预测装置确定第一靶标关联矩阵的过程进行介绍。
[0172]
作为本公开的一种可能的实施例,结合图2,如图6所示,上述步骤202可以通过以下步骤603-步骤604实现:
[0173]
步骤603、预测装置将靶标属性信息以及靶标标识向量输入第三图卷积模型中,得到初始靶标关联矩阵。
[0174]
其中,初始靶标关联矩阵用于表征多个靶标在每个靶标属性上的特征信息。
[0175]
靶标标识向量用于标识每个靶标。靶标标识向量可以包括多个靶标的靶标序列频率向量。
[0176]
示例性的,靶标序列可以为一级结构序列、二级结构序列、三级结构序列或者四级结构序列中的任一项。
[0177]
以一级结构序列为例,靶标包含20类氨基酸,每种氨基酸通过一个字母表示,本领域通常将氨基酸按照理化性质分为7类,分别为:{a,g,v}、{i,l,f,p}、{y,m,t,s}、{h,n,q,w}、{r,k}、{d,e}以及{c}。上述7类氨基酸可通过数字1-7表示。
[0178]
例如靶标序列alqdvg可通过“124611”表示。另外,靶标序列可通过kmer统计方法编码,其中k指靶标序列中的最小元组。例如上述靶标序列的3-mer为:124、246、461、611。
[0179]
在此情况下,靶标序列频率向量可以按照每个3mer的数量频率表示,其中,3mer的种类包括7*7*7=343种。
[0180]
如下表4所示:
[0181]
表4靶标3mer的种类、数量与频率关系表
[0182]
种类111

135

274

777数量321 835 34 85频率0.214 0.556 0.023 0.057
[0183]
其中,该靶标包括1500个3mer,靶标序列频率向量由每个3mer的频率组成。该靶标的3mer种类“111”存在的数量为321,因此3mer种类“111”的频率为321/1500=0.214,以此类推。
[0184]
初始靶标关联矩阵的相关内容可参考上述步骤601中的初始药物关联矩阵的描述,此处不再赘述。
[0185]
步骤604、预测装置将初始靶标关联矩阵输入第四图卷积模型中,得到第一靶标关联矩阵。
[0186]
其中,第四图卷积模型用于根据多个靶标属性对于每个靶标的影响程度调整每个靶标的特征信息。
[0187]
相关内容可参考上述步骤602中的描述,此处不再赘述。
[0188]
基于上述技术方案,本公开中的预测装置可以先通过多个靶标在同一个靶标属性上的靶标属性信息以及靶标标识向量,执行图内卷积操作,得到初始靶标关联矩阵。该初始靶标关联矩阵用于表征每个靶标属性上,多个靶标的特征信息。之后,预测装置可以针对初始靶标关联矩阵执行图间卷积操作,即根据多个靶标属性对于每个靶标的影响程度调整每个靶标的特征信息,以使得所提取的靶标的特征信息更加准确。
[0189]
以下,对预测装置确定药物属性信息的过程进行介绍。
[0190]
作为本公开的一种可能的实施例,如图9所示,在预测装置确定第一药物关联矩阵之前,该方法还包括:
[0191]
步骤901、预测装置获取药物属性向量。
[0192]
其中,药物属性向量包括多个药物的药物结构向量、药效团向量、副作用向量以及靶向基因向量中的至少一项。
[0193]
其中,药物结构向量可参考上述步骤601中的相关描述,此处不再赘述。
[0194]
药效团向量用于表征药物的药效团指纹信息。药效团为药物分子对给定靶标具有活性所需的相关特征和相互作用的特定结构。
[0195]
一种可能的实现方式中,预测装置可以通过基于子结构的指纹方式编码药物分子的结构特征,并根据特征之间的距离范围分类生成药效团向量。
[0196]
示例性的,当药物存在某一药效团时,则该药效团对应的药效团向量的位置上为该药效团的数量。或者,通过“1”表示药物中存在该药效团向量的向量位置对应的药效团,通过“0”表示药物中不存在该药效团向量的向量位置对应的药效团。
[0197]
副作用向量用于表征药物的副作用信息。例如,当副作用向量中的对应位置为“1”时,表示药物存在该位置对应的副作用,当副作用向量中的对应位置为“0”时,表示药物不存在该位置对应的副作用。
[0198]
靶向基因向量用于表征药物能够作用的靶标信息。该靶标信息可以为基因本体论(gene ontology)规定的标识信息。例如药物1能够作用的靶标为靶标1,该靶标1的靶标信息为go:0005739。
[0199]
步骤902、预测装置根据药物属性向量确定药物属性信息。
[0200]
其中,药物属性信息包括多个药物的药物结构相似度、药效团相似度、副作用相似度以及基于go通路的相似度中的至少一项。
[0201]
药物结构相似度是指药物之间在化学结构上的相似程度,药效团相似度是指药物之间在药效团组成上的相似程度,副作用相似度是指药物之间存在的副作用的相似程度,基于go通路的相似度是指药物能够作用的靶标的相似程度。
[0202]
基于上技术方案,预测装置可以获取药物属性向量并根据药物属性向量确定多个药物的在不同维度上的药物属性信息,以便于后续根据药物属性信息确定第一药物关联矩阵,从而更全面地表征该多个药物的特征信息。
[0203]
以下针对多个药物中的第一药物和第二药物,对上述步骤901-步骤902进行说明。
[0204]
其中,第一药物和第二药物为多个药物中的药物。第一药物与第二药物可以为同一个药物,第一药物与第二药物也可以为不同药物。
[0205]
预测装置确定第一药物与第二药物之间的药物结构相似度的过程如下:
[0206]
预测装置可以获取第一药物的药物结构向量和第二药物的药物结构向量,并根据第一药物的药物结构向量和第二药物的药物结构向量,确定第一药物和第二药物之间的药物结构相似度。
[0207]
示例性的,预测装置可以从pubchem数据库中获取药物的药物结构向量。预测装置可以通过jacaard指数或者余弦相似度的方式确定第一药物和第二药物之间的药物结构相似度。
[0208]
例如,药物结构相似度满足以下公式4或公式5:
[0209]
[0210]
其中,表示第一药物和第二药物之间的药物结构相似度,xi表示第一药物的药物结构向量,xj表示第二药物的药物结构向量,|xi∩xj|表示第一药物和第二药物的药物结构向量中对应位置均为“1”的数量,即第一药物与第二药物具有的相同结构类型的数量。|xi∪xj|表示第一药物和第二药物的药物结构向量中对应位置存在“1”的数量,即第一药物与第二药物具有的结构类型的总数量。
[0211][0212]
其中,表示第一药物和第二药物之间的药物结构相似度,xi表示第一药物的药物结构向量,xj表示第二药物的药物结构向量,xi·
xj表示第一药物的药物结构向量与第二药物的药物结构向量之间的内积,‖xi‖表示第一药物的药物结构向量的模长,||xj||表示第二药物的药物结构向量的模长。
[0213]
预测装置确定第一药物与第二药物之间的药效团相似度的过程如下:
[0214]
预测装置可以获取第一药物的药效团向量和第二药物的药效团向量,并根据第一药物的药效团向量和第二药物的药效团向量,确定第一药物和第二药物之间的药效团相似度。
[0215]
示例性的,预测装置可以通过jacaard指数或者余弦相似度的方式确定第一药物和第二药物之间的药效团相似度。实现方式可参考上述确定药物结构相似度的相关描述,此处不再赘述。
[0216]
预测装置确定第一药物与第二药物之间的副作用相似度的过程如下:
[0217]
预测装置可以获取第一药物的副作用向量和第二药物的副作用向量,并根据第一药物的副作用向量和第二药物的副作用向量,确定第一药物和第二药物之间的副作用相似度。
[0218]
示例性的,预测装置可以通过jacaard指数或者余弦相似度的方式确定第一药物和第二药物之间的副作用相似度。实现方式可参考上述确定药物结构相似度的相关描述,此处不再赘述。
[0219]
以下,对预测装置确定第一药物与第二药物的基于go通路的相似度的过程进行介绍。
[0220]
作为本公开的一种可能的实施例,如图10所示,在预测装置确定第一药物关联矩阵之前,该方法还包括:
[0221]
步骤1001、预测装置获取第一药物的第一作用靶标和第二药物的第二作用靶标。
[0222]
示例性的,预测装置可以从go数据库中获取药物的作用靶标。第一作用靶标包括靶标a、靶标b以及靶标c。第二作用靶标包括靶标d与靶标e。第一作用靶标与第二作用靶标可以通过靶向基因向量的形式表示,相关内容可参考上述步骤901,此处不再赘述。
[0223]
步骤1002、预测装置计算第一作用靶标和第二作用靶标之间的序列相似度。
[0224]
一种可能的实现方式中,预测装置可以通过go相似度算法计算第一作用靶标和第二作用靶标之间的序列相似度。
[0225]
示例性的,go相似度算法可以为r语言中gosemsim工具包中的相似度算法。
[0226]
结合上述示例,预测装置分别计算靶标a与靶标d的相似度,靶标a与靶标e的相似
度,靶标b与靶标d的相似度,靶标b与靶标e的相似度,靶标c与靶标d的相似度,靶标c与靶标e的相似度。
[0227]
步骤1003、预测装置根据第一作用靶标和第二作用靶标之间的序列相似度对第一作用靶标与第二作用靶标进行匹配,得到至少一个作用靶标对。
[0228]
一种可能的实现方式中,预测装置可以通过匹配算法确定第一作用靶标与第二作用靶标之间的匹配关系。
[0229]
示例性的,该匹配算法可以为匈牙利算法(hungarian algorithm)、km算法(kuhn-munkres algorithm)。
[0230]
结合上述示例,预测装置确定作用靶标对包括:靶标a-靶标e,靶标b-靶标d。靶标c无相匹配的靶标。
[0231]
步骤1004、预测装置根据至少一个作用靶标对的序列相似度确定第一药物和第二药物之间的基于go通路的相似度。
[0232]
示例性的,基于go通路的相似度满足以下公式6:
[0233][0234]
其中,sg表示第一药物和第二药物之间的基于go通路的相似度,s
match
表示作用靶标对中两个靶标的序列相似度,n
match
表示作用靶标对的数量。
[0235]
基于上述技术方案,预测装置可以将第一药物与第二药物的作用靶标对的相似度均值作为第一药物和第二药物之间的基于go通路的相似度,从而体现第一药物与第二药物在作用靶标方面的相似程度。
[0236]
以下,结合上述步骤1004,对预测装置确定基于go通路的相似度的过程进行介绍。
[0237]
作为本公开的一种可能的实施例,结合图10,如图11所示,上述步骤1004还可以通过以下步骤1101-步骤1102实现:
[0238]
步骤1101、预测装置确定至少一个作用靶标对中的作用靶标数量与第一作用靶标和第二作用靶标的作用靶标总数量的数量比值。
[0239]
结合上述示例,作用靶标对中的作用靶标数量为4,第一作用靶标和第二作用靶标的作用靶标总数量为5,该数量比值为0.8。
[0240]
步骤1102、预测装置根据至少一个作用靶标对的序列相似度以及数量比值确定第一药物和第二药物之间的基于go通路的相似度。
[0241]
示例性的,基于go通路的相似度满足以下公式7:
[0242][0243]
其中,sg表示第一药物和第二药物之间的基于go通路的相似度,s
match
表示作用靶标对中两个靶标的序列相似度,n
match
表示作用靶标对的数量,ng表示数量比值。
[0244]
基于上述技术方案,预测装置可以在计算第一药物和第二药物之间的基于go通路的相似度时,进一步考虑匹配的靶标数量占比对第一药物和第二药物之间的基于go通路的相似度的影响。
[0245]
以下,对预测装置确定靶标结构相似度的过程进行介绍。
[0246]
作为本公开的一种可能的实施例,如图12所示,在预测装置确定第一靶标关联矩阵之前,该方法还包括:
[0247]
步骤1201、预测装置获取第一靶标的靶标序列和第二靶标的靶标序列。
[0248]
其中,第一靶标和第二靶标为多个靶标中的靶标。第一靶标和第二靶标可以为多个靶标中的同一个靶标,也可以为多个靶标中的不同靶标。
[0249]
靶标序列用于表征靶标的化学结构。靶标序列可以为一级结构、二级结构、三级结构以及四级结构中的至少一项。
[0250]
以一级结构为例,蛋白质包含20类氨基酸,每种氨基酸通过一个字母表示。例如第一靶标的靶标序列可以为“msfiktfsgkhfy”,第二靶标的靶标序列可以为“msiktfhgkqfy”。
[0251]
步骤1202、预测装置根据第一靶标的靶标序列和第二靶标的靶标序列,确定第一靶标和第二靶标之间的靶标结构相似度。
[0252]
一种可能的实现方式中,预测装置可以通过编辑距离(又称levenshtein距离)确定第一靶标和第二靶标之间的靶标结构相似度。
[0253]
编辑距离是指从第一靶标的靶标序列转换成第二靶标的靶标序列所需要的最少编辑操作次数。编辑操作包括以下方式:将其中一个字符替换为另一个字符;插入一个字符;删除一个字符。因此,编辑距离越小,则说明第一靶标和第二靶标之间的靶标结构相似度越大。反之,编辑距离越大,则说明第一靶标和第二靶标之间的靶标结构相似度越小。
[0254]
示例性的,编辑距离的计算方法可以为加若(jaro)算法。第一靶标和第二靶标之间的靶标结构相似度满足以下公式8:
[0255][0256]
其中,dj为第一靶标和第二靶标之间的靶标结构相似度,|s1|表示第一靶标的靶标序列中的字符数,|s2|表示第二靶标的靶标序列中的字符数,k表示第一靶标的靶标序列和第二靶标的靶标序列中匹配的字符数,t表示匹配的字符数中需要换位(transpositions)的数目。
[0257]
基于上技术方案,预测装置可以获取第一靶标的靶标序列和第二靶标的靶标序列,并根据第一靶标的靶标序列和第二靶标的靶标序列,确定第一靶标和第二靶标之间的靶标结构相似度。如此一来,预测装置可以确定多个药物两两之间的靶标结构相似度,以便于后续确定第一靶标关联矩阵。
[0258]
本公开实施例可以根据上述方法示例对物靶标相互作用预测装置进行功能模块或者功能单元的划分,例如,可以对应各个功能划分各个功能模块或者功能单元,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块或者功能单元的形式实现。其中,本公开实施例中对模块或者单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
[0259]
如图13所示,为根据一些实施例提供的一种药物与靶标的相互作用预测装置130的结构示意图,该药物与靶标的相互作用预测装置130包括:
[0260]
处理单元1301,被配置为根据药物属性信息确定第一药物关联矩阵。药物属性信息包括多个药物的药物结构相似度、药效团相似度、副作用相似度以及基于go通路的相似
度中的至少一项。第一药物关联矩阵用于表征每个药物在至少一个药物属性上的特征信息。
[0261]
处理单元1301,还被配置为根据靶标属性信息确定第一靶标关联矩阵。靶标属性信息包括多个靶标的靶标结构相似度以及靶标互作用关系中的至少一项。第一靶标关联矩阵用于表征每个靶标在至少一个靶标属性上的特征信息。
[0262]
处理单元1301,还被配置为根据第一药物关联矩阵和第一靶标关联矩阵预测药物与靶标之间的作用概率。
[0263]
在一些实施例中,处理单元1301,被配置为将药物属性信息以及药物标识向量输入第一图卷积模型中,得到初始药物关联矩阵;初始药物关联矩阵用于表征多个药物在每个药物属性上的特征信息;处理单元1301,还被配置为将初始药物关联矩阵输入第二图卷积模型中,得到第一药物关联矩阵;第二图卷积模型用于根据多个药物属性对于药物的影响程度调整药物的特征信息。
[0264]
在一些实施例中,获取单元1302,被配置为获取药物属性向量;药物属性向量包括多个药物的药物结构向量、药效团向量、副作用向量以及靶向基因向量中的至少一项;处理单元1301,被配置为根据药物属性向量确定药物属性信息。
[0265]
在一些实施例中,获取单元1302,被配置为获取第一药物的药物结构向量和第二药物的药物结构向量;第一药物和第二药物为多个药物中的药物;处理单元1301,被配置为根据第一药物的药物结构向量和第二药物的药物结构向量,确定第一药物和第二药物之间的药物结构相似度。
[0266]
在一些实施例中,获取单元1302,被配置为获取第一药物的药效团向量和第二药物的药效团向量;第一药物和第二药物为多个药物中的药物;处理单元1301,被配置为根据第一药物的药效团向量和第二药物的药效团向量,确定第一药物和第二药物之间的药效团相似度。
[0267]
在一些实施例中,获取单元1302,被配置为获取第一药物的副作用向量和第二药物的副作用向量;第一药物和第二药物为多个药物中的药物;处理单元1301,被配置为根据第一药物的副作用向量和第二药物的副作用向量,确定第一药物和第二药物之间的副作用相似度。
[0268]
在一些实施例中,获取单元1302,被配置为获取第一药物的第一作用靶标和第二药物的第二作用靶标;第一药物和第二药物为多个药物中的药物;处理单元1301,被配置为计算第一作用靶标和第二作用靶标之间的序列相似度;处理单元1301,还被配置为根据第一作用靶标和第二作用靶标之间的序列相似度对第一作用靶标与第二作用靶标进行匹配,得到至少一个作用靶标对;处理单元1301,还被配置为根据至少一个作用靶标对的序列相似度确定第一药物和第二药物之间的基于go通路的相似度。
[0269]
在一些实施例中,处理单元1301,被配置为确定至少一个作用靶标对中的作用靶标数量与第一作用靶标和第二作用靶标的作用靶标总数量的数量比值;处理单元1301,还被配置为根据至少一个作用靶标对的序列相似度以及数量比值确定第一药物和第二药物之间的基于go通路的相似度。
[0270]
在一些实施例中,处理单元1301,被配置为将靶标属性信息以及靶标标识向量输入第三图卷积模型中,得到初始靶标关联矩阵;初始靶标关联矩阵用于表征多个靶标在每
个靶标属性上的特征信息;处理单元1301,还被配置为将初始靶标关联矩阵输入第四图卷积模型中,得到第一靶标关联矩阵;第四图卷积模型用于根据多个靶标属性对于每个靶标的影响程度调整每个靶标的特征信息。
[0271]
在一些实施例中,获取单元1302,被配置为获取第一靶标的靶标序列和第二靶标的靶标序列;第一靶标和第二靶标为多个靶标中的靶标;处理单元1301,被配置为根据第一靶标的靶标序列和第二靶标的靶标序列,确定第一靶标和第二靶标之间的靶标结构相似度。
[0272]
在一些实施例中,处理单元,被配置为将第一药物关联矩阵和第一靶标关联矩阵输入第一融合模型中,得到药物与靶标之间的作用概率。
[0273]
在一些实施例中,处理单元1301,被配置为根据第一药物关联矩阵中每个药物在至少一个药物属性上的最大特征值确定第二药物关联矩阵;第一药物关联矩阵包括每个药物在至少一个药物属性上的特征值;处理单元1301,还被配置为根据第一靶标关联矩阵中每个靶标在至少一个靶标属性上的最大特征值确定第二靶标关联矩阵;第一靶标关联矩阵包括每个靶标在至少一个靶标属性上的特征值;处理单元1301,还被配置为将第二药物关联矩阵和第二靶标关联矩阵输入第二融合模型中,得到药物与靶标之间的作用概率。
[0274]
在通过硬件实现时,本公开实施例中的获取单元1302可以集成在通信接口上,处理单元1301可以集成在处理器上。具体实现方式如图14所示。
[0275]
图14示出了上述实施例中所涉及的药物与靶标的相互作用预测装置的又一种可能的结构示意图。该药物与靶标的相互作用预测装置140包括:处理器1402和通信接口1403。处理器1402被配置为对药物与靶标的相互作用预测装置140的动作进行控制管理,例如,执行上述处理单元1301执行的步骤,和/或被配置为执行本文所描述的技术的其它过程。通信接口1403被配置为支持药物与靶标的相互作用预测装置140与其他网络实体的通信,例如,执行上述获取单元1302执行的步骤。药物与靶标的相互作用预测装置140还可以包括存储器1401和总线1404,存储器1401被配置为存储药物与靶标的相互作用预测装置140的程序代码和数据。
[0276]
其中,存储器1401可以是药物与靶标的相互作用预测装置140中的存储器等,该存储器可以包括易失性存储器,例如随机存取存储器;该存储器也可以包括非易失性存储器,例如只读存储器,快闪存储器,硬盘或固态硬盘;该存储器还可以包括上述种类的存储器的组合。
[0277]
上述处理器1402可以是实现或执行结合本公开公开内容所描述的各种示例性的逻辑方框,模块和电路。该处理器可以是中央处理器,通用处理器,数字信号处理器,专用集成电路,现场可编程门阵列或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本公开公开内容所描述的各种示例性的逻辑方框,模块和电路。该处理器也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,dsp和微处理器的组合等。
[0278]
总线1404可以是扩展工业标准结构(extended industry standard architecture,eisa)总线等。总线1404可以分为地址总线、数据总线、控制总线等。为便于表示,图14中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
[0279]
图14中的药物与靶标的相互作用预测装置140还可以为芯片。该芯片包括一个或
两个以上(包括两个)处理器1402和通信接口1403。
[0280]
在一些实施例中,该芯片还包括存储器1401,存储器1401可以包括只读存储器和随机存取存储器,并向处理器1402提供操作指令和数据。存储器1401的一部分还可以包括非易失性随机存取存储器(non-volatile random access memory,nvram)。
[0281]
在一些实施方式中,存储器1401存储了如下的元素,执行模块或者数据结构,或者他们的子集,或者他们的扩展集。
[0282]
在本公开实施例中,通过调用存储器1401存储的操作指令(该操作指令可存储在操作系统中),执行相应的操作。
[0283]
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0284]
本公开的一些实施例提供了一种计算机可读存储介质(例如,非暂态计算机可读存储介质),该计算机可读存储介质中存储有计算机程序指令,计算机程序指令在计算机(例如,药物与靶标的相互作用预测装置)上运行时,使得计算机执行如上述实施例中任一实施例所述的药物与靶标的相互作用预测方法。
[0285]
示例性的,上述计算机可读存储介质可以包括,但不限于:磁存储器件(例如,硬盘、软盘或磁带等),光盘(例如,cd(compact disk,压缩盘)、dvd(digital versatile disk,数字通用盘)等),智能卡和闪存器件(例如,eprom(erasable programmable read-only memory,可擦写可编程只读存储器)、卡、棒或钥匙驱动器等)。本公开描述的各种计算机可读存储介质可代表用于存储信息的一个或多个设备和/或其它机器可读存储介质。术语“机器可读存储介质”可包括但不限于,无线信道和能够存储、包含和/或承载指令和/或数据的各种其它介质。
[0286]
本公开的一些实施例还提供了一种计算机程序产品,例如该计算机程序产品存储在非瞬时性的计算机可读存储介质上。该计算机程序产品包括计算机程序指令,在计算机(例如,药物与靶标的相互作用预测装置)上执行该计算机程序指令时,该计算机程序指令使计算机执行如上述实施例所述的药物与靶标的相互作用预测方法。
[0287]
本公开的一些实施例还提供了一种计算机程序。当该计算机程序在计算机(例如,药物与靶标的相互作用预测装置)上执行时,该计算机程序使计算机执行如上述实施例所述的药物与靶标的相互作用预测方法。
[0288]
本公开的一些实施例还提供一种药物与靶标的相互作用预测装置,该装置包括:处理器和存储器;存储器用于存储计算机程序或指令,处理器用于运行计算机程序或指令,以实现如上述任一实施例所述的药物与靶标的相互作用预测方法。
[0289]
上述计算机可读存储介质、计算机程序产品、计算机程序以及药物与靶标的相互作用预测装置的有益效果和上述一些实施例所述的药物与靶标的相互作用预测方法的有益效果相同,此处不再赘述。
[0290]
在本公开所提供的几个实施例中,应该理解到,所揭露的系统、设备和方法,可以通过其它的方式实现。例如,以上所描述的设备实施例仅仅是示意性的,例如,所述单元的
划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0291]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0292]
另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
[0293]
以上所述,仅为本公开的具体实施方式,但本公开的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,想到变化或替换,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应以所述权利要求的保护范围为准。

技术特征:


1.一种药物与靶标的相互作用预测方法,其特征在于,包括:根据药物属性信息确定第一药物关联矩阵;所述药物属性信息包括多个药物的药物结构相似度、药效团相似度、副作用相似度以及基于基因本体论go通路的相似度中的至少一项;所述第一药物关联矩阵用于表征每个药物在至少一个药物属性上的特征信息;根据靶标属性信息确定第一靶标关联矩阵;所述靶标属性信息包括多个靶标的靶标结构相似度以及靶标互作用关系中的至少一项;所述第一靶标关联矩阵用于表征每个靶标在至少一个靶标属性上的特征信息;根据所述第一药物关联矩阵和所述第一靶标关联矩阵预测药物与靶标之间的作用概率。2.根据权利要求1所述的方法,其特征在于,所述根据药物属性信息确定第一药物关联矩阵,包括:将所述药物属性信息以及药物标识向量输入第一图卷积模型中,得到初始药物关联矩阵;所述初始药物关联矩阵用于表征所述多个药物在每个药物属性上的特征信息;将所述初始药物关联矩阵输入第二图卷积模型中,得到所述第一药物关联矩阵;所述第二图卷积模型用于根据多个药物属性对于药物的影响程度调整所述药物的特征信息。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取药物属性向量;所述药物属性向量包括所述多个药物的药物结构向量、药效团向量、副作用向量以及靶向基因向量中的至少一项;根据所述药物属性向量确定所述药物属性信息。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取第一药物的药物结构向量和第二药物的药物结构向量;所述第一药物和所述第二药物为所述多个药物中的药物;根据所述第一药物的药物结构向量和所述第二药物的药物结构向量,确定所述第一药物和所述第二药物之间的药物结构相似度。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取第一药物的药效团向量和第二药物的药效团向量;所述第一药物和所述第二药物为所述多个药物中的药物;根据所述第一药物的药效团向量和所述第二药物的药效团向量,确定所述第一药物和所述第二药物之间的药效团相似度。6.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取第一药物的副作用向量和第二药物的副作用向量;所述第一药物和所述第二药物为所述多个药物中的药物;根据所述第一药物的副作用向量和所述第二药物的副作用向量,确定所述第一药物和所述第二药物之间的副作用相似度。7.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取第一药物的第一作用靶标和第二药物的第二作用靶标;所述第一药物和所述第二药物为所述多个药物中的药物;计算所述第一作用靶标和所述第二作用靶标之间的序列相似度;根据所述第一作用靶标和所述第二作用靶标之间的序列相似度对所述第一作用靶标
与第二作用靶标进行匹配,得到至少一个作用靶标对;根据所述至少一个作用靶标对的序列相似度确定所述第一药物和所述第二药物之间的基于go通路的相似度。8.根据权利要求7所述的方法,其特征在于,所述根据所述至少一个作用靶标对的序列相似度确定所述第一药物和所述第二药物之间的基于go通路的相似度,包括:确定所述至少一个作用靶标对中的作用靶标数量与所述第一作用靶标和所述第二作用靶标的作用靶标总数量的数量比值;根据所述至少一个作用靶标对的序列相似度以及所述数量比值确定所述第一药物和所述第二药物之间的基于go通路的相似度。9.根据权利要求1-8中任一项所述的方法,其特征在于,所述根据靶标属性信息确定第一靶标关联矩阵,包括:将所述靶标属性信息以及靶标标识向量输入第三图卷积模型中,得到初始靶标关联矩阵;所述初始靶标关联矩阵用于表征所述多个靶标在每个靶标属性上的特征信息;将所述初始靶标关联矩阵输入第四图卷积模型中,得到所述第一靶标关联矩阵;所述第四图卷积模型用于根据多个靶标属性对于每个靶标的影响程度调整所述每个靶标的特征信息。10.根据权利要求1-8中任一项所述的方法,其特征在于,所述方法还包括:获取第一靶标的靶标序列和第二靶标的靶标序列;所述第一靶标和所述第二靶标为所述多个靶标中的靶标;根据所述第一靶标的靶标序列和所述第二靶标的靶标序列,确定所述第一靶标和所述第二靶标之间的靶标结构相似度。11.根据权利要求1-8中任一项所述的方法,其特征在于,所述根据所述第一药物关联矩阵和所述第一靶标关联矩阵预测药物与靶标之间的作用概率,包括:将所述第一药物关联矩阵和所述第一靶标关联矩阵输入第一融合模型中,得到所述药物与靶标之间的作用概率。12.根据权利要求1-8中任一项所述的方法,其特征在于,所述根据所述第一药物关联矩阵和所述第一靶标关联矩阵预测药物与靶标之间的作用概率,包括:根据所述第一药物关联矩阵中每个药物在至少一个药物属性上的最大特征值确定第二药物关联矩阵;所述第一药物关联矩阵包括所述每个药物在至少一个药物属性上的特征值;根据所述第一靶标关联矩阵中每个靶标在至少一个靶标属性上的最大特征值确定第二靶标关联矩阵;所述第一靶标关联矩阵包括所述每个靶标在至少一个靶标属性上的特征值;将所述第二药物关联矩阵和所述第二靶标关联矩阵输入第二融合模型中,得到所述药物与靶标之间的作用概率。13.一种药物与靶标的相互作用预测装置,其特征在于,包括:处理单元,被配置为根据药物属性信息确定第一药物关联矩阵;所述药物属性信息包括多个药物的药物结构相似度、药效团相似度、副作用相似度以及基于基因本体论go通路的相似度中的至少一项;所述第一药物关联矩阵用于表征每个药物在至少一个药物属性上
的特征信息;所述处理单元,还被配置为根据靶标属性信息确定第一靶标关联矩阵;所述靶标属性信息包括多个靶标的靶标结构相似度以及靶标互作用关系中的至少一项;所述第一靶标关联矩阵用于表征每个靶标在至少一个靶标属性上的特征信息;所述处理单元,还被配置为根据所述第一药物关联矩阵和所述第一靶标关联矩阵预测药物与靶标之间的作用概率。14.一种药物与靶标的相互作用预测装置,其特征在于,包括:处理器和存储器;所述存储器用于存储计算机程序或指令,所述处理器用于运行计算机程序或指令,以实现如权利要求1-12任一项中所述的药物与靶标的相互作用预测方法。15.一种非暂态计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有指令,当计算机执行所述指令时,所述计算机执行如权利要求1-12任一项中所述的药物与靶标的相互作用预测方法。16.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序指令,在计算机上执行所述计算机程序指令时,所述计算机程序指令使计算机执行如权利要求1-12任一项中所述的药物与靶标的相互作用预测方法。

技术总结


本公开提供一种药物与靶标的相互作用预测方法、装置及存储介质,涉及生物医疗领域,能够解决相关技术中预测药物与靶标的相互作用的准确度低下的问题。该方法包括:根据药物属性信息确定第一药物关联矩阵;药物属性信息包括多个药物的药物结构相似度、药效团相似度、副作用相似度以及基于基因本体论GO通路的相似度中的至少一项;第一药物关联矩阵用于表征每个药物在至少一个药物属性上的特征信息;根据靶标属性信息确定第一靶标关联矩阵;第一靶标关联矩阵用于表征每个靶标在至少一个靶标属性上的特征信息;根据第一药物关联矩阵和第一靶标关联矩阵预测药物与靶标之间的作用概率。本公开能够提高预测准确度。本公开能够提高预测准确度。本公开能够提高预测准确度。


技术研发人员:

王斯凡 梁烁斌

受保护的技术使用者:

京东方科技集团股份有限公司

技术研发日:

2022.08.18

技术公布日:

2022/11/18

本文发布于:2024-09-22 08:22:38,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/3490.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:靶标   药物   矩阵   向量
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议