基于数据集成的肿瘤跨适应症联合用药推荐方法和系统与流程



1.本技术涉及生物信息学领域,特别涉及一种基于数据集成的肿瘤跨适应症联合用药推荐方法和系统。


背景技术:



2.传统药物仅针对单一靶标的单一化合物进行研发,复杂的疾病,类似肿瘤,对应着复杂的生物过程,一对一的药物-靶标作用模式在肿瘤的中已经无法达到显著疗效。所以针对肿瘤等复杂的疾病需要进行多靶点分析,并通过跨适应症联合用药来加快其进程。
3.而整合多种来源的数据和知识是药物设计、药物再利用和多靶标疗法成功的关键因素。多组学数据融合的生物网络能够突出肿瘤作用背后的关系并模拟肿瘤现象。


技术实现要素:



4.(一)申请目的基于此,本发明的目的是通过集成多种数据,以及开发新颖的生物信息学流程,将基于网络的模型应用到生信分析流程中,识别肿瘤潜在的多靶点疗法以及实现其跨适应症联合用药的推荐。基于上述目的,本技术公开了以下技术方案。
5.(二)技术方案本技术公开了一种基于数据集成的肿瘤跨适应症联合用药推荐方法,其特征在于,包括:获取肿瘤的靶向蛋白列表;基于上述靶向蛋白列表生成候选药物列表;构建并优化药物响应预测模型;基于上述药物响应预测模型推荐上述候选药物列表中的最佳药物组合。
6.在一种可能的实施方式中,上述获取肿瘤的靶向蛋白列表,包括:构建肿瘤的特异ppi网络,并筛选若干个潜在靶向蛋白;对上述潜在靶向蛋白的目标组合进行评分,生成靶向蛋白列表。
7.在一种可能的实施方式中,上述构建肿瘤的特异ppi网络,并筛选若干个潜在靶向蛋白,包括:筛选肿瘤相关基因,生成相关基因列表;获取上述相关基因列表中各基因的相关编码蛋白质;获取与上述相关编码蛋白质互作的蛋白质,构建肿瘤的特异ppi网络;选择上述肿瘤的特异ppi网络的部分桥接蛋白节点,并对上述桥接蛋白节点进行过滤,获取若干个潜在靶向蛋白。
8.在一种可能的实施方式中,上述肿瘤相关基因为显著突变且在肿瘤中显著差异化
表达的基因。
9.在一种可能的实施方式中,上述与上述相关编码蛋白质互作的蛋白质是从string数据库中筛选的。
10.在一种可能的实施方式中,上述选择上述肿瘤的特异ppi网络的部分桥接蛋白节点,并对上述桥接蛋白节点进行过滤,获取若干个潜在靶向蛋白,包括:对上述肿瘤特异的ppi网络进行节点度值排序,选择前20%的桥接蛋白节点;利用stich数据库和drugbank数据库对上述前20%的桥接蛋白节点进行过滤,获取若干个潜在靶向蛋白。
11.在一种可能的实施方式中,上述对上述潜在靶向蛋白的目标组合进行评分,生成靶向蛋白列表,包括:计算上述潜在靶向蛋白的目标组合的tsds评分和空间分布;基于上述tsds评分和上述空间分布选取评分大于零的潜在靶向蛋白,生成靶向蛋白列表。
12.在一种可能的实施方式中,上述基于上述靶向蛋白列表生成候选药物列表,包括:提取与上述靶向蛋白列表中的靶向蛋白互作的药物,生成初步候选药物列表;将应用于其他疾病的药物添加至上述初步候选药物列表,生成候选药物列表。
13.在一种可能的实施方式中,上述与上述靶向蛋白列表中的靶向蛋白互作药物是从drugbank数据库和ctd储存库中提取的。
14.在一种可能的实施方式中,上述将应用于其他疾病的药物添加至上述初步候选药物列表是基于矩阵三因子算法进行的。
15.在一种可能的实施方式中,上述矩阵三因子包括疾病-基因、药物-靶标和蛋白质-蛋白质。
16.在一种可能的实施方式中,上述矩阵三因子算法应用的数据源包括diseaseontology、drugbank、string、generif和ttd。
17.在一种可能的实施方式中,上述构建并优化药物响应预测模型,包括:提取肿瘤的相关通路,并将上述相关通路的调节反应转化为逻辑公式,构建药物响应预测模型;整合基因转录组的表达数据优化上述药物响应预测模型,并对上述药物响应预测模型dp节点和tp节点的值进行初始化设置。
18.在一种可能的实施方式中,上述肿瘤的相关通路是从kegg数据库中提取的。
19.在一种可能的实施方式中,上述整合基因转录组的表达数据优化上述药物响应预测模型,具体为:从疾病数据库提取差异表达基因,生成差异表达基因列表;基于上述差异表达基因的fc值确定基因上调或下调,优化上述药物响应预测模型。
20.在一种可能的实施方式中,上述差异表达基因为fc值大于2的基因。
21.在一种可能的实施方式中,当上述差异表达基因在多个实验中上调和下调的次数相等时,则丢弃上述差异表达基因。
22.在一种可能的实施方式中,基于上述药物响应预测模型获取上述候选药物列表中
的最佳药物组合,包括:计算上述药物响应预测模型其它节点的值,并将上述药物响应预测模型转化为ode;基于上述ode分析上述候选药物列表中的药物-药物间联合使用效果,生成药物组合列表;定义effect指数为上述药物组合列表中的药物组合进行评分,推荐最佳药物组合。
23.在一种可能的实施方式中,上述其它节点为上述药物响应预测模型中除dp节点和tp节点以外的节点。
24.作为本技术的第二方面,本技术还公开了一种基于数据集成的肿瘤跨适应症药效测评系统,包括:靶向蛋白列表获取模块,用于获取肿瘤的靶向蛋白列表;候选药物列表生成模块,用于基于上述靶向蛋白列表生成候选药物列表;预测模型构建优化模块,用于构建并优化药物响应预测模型;最佳组合推荐模块,用于基于上述药物响应预测模型获取上述候选药物列表中的最佳药物组合。
25.在一种可能的实施方式中,上述靶向蛋白列表获取模块包括:ppi网络构建子模块,用于构建肿瘤的特异ppi网络,并筛选若干个潜在靶向蛋白;靶向蛋白列表获取子模块,用于对上述潜在靶向蛋白的目标组合进行评分,生成靶向蛋白列表。
26.在一种可能的实施方式中,上述ppi网络构建子模块,包括:相关基因列表生成单元,用于筛选肿瘤相关基因,生成相关基因列表;编码蛋白质获取单元,用于获取上述相关基因列表中各基因的相关编码蛋白质;ppi网络构建单元,用于获取与上述相关编码蛋白质互作的蛋白质,构建肿瘤的特异ppi网络;潜在靶向蛋白获取单元,用于选择上述肿瘤的特异ppi网络的部分桥接蛋白节点,并对上述桥接蛋白节点进行过滤,获取若干个潜在靶向蛋白。
27.在一种可能的实施方式中,上述肿瘤相关基因为显著突变且在肿瘤中显著差异化表达的基因。
28.在一种可能的实施方式中,上述与上述相关编码蛋白质互作的蛋白质是从string数据库中筛选的。
29.在一种可能的实施方式中,所潜在靶向蛋白获取单元,包括:排序选择子单元,用于对上述肿瘤特异的ppi网络进行节点度值排序,选择前20%的桥接蛋白节点;过滤子单元,用于利用stich数据库和drugbank数据库对上述前20%的桥接蛋白节点进行过滤,获取若干个潜在靶向蛋白。
30.在一种可能的实施方式中,上述靶向蛋白列表获取子模块,包括:评分计算单元,用于计算上述潜在靶向蛋白的目标组合的tsds评分和空间分布;靶向蛋白列表获取单元,用于基于上述tsds评分和上述空间分布选取评分大于零
的潜在靶向蛋白,生成靶向蛋白列表。
31.在一种可能的实施方式中,上述候选药物列表生成模块,包括:初步候选药物列表子模块,用于提取与上述靶向蛋白列表中的靶向蛋白互作的药物,生成初步候选药物列表;候选药物列表生成子模块,用于将应用于其他疾病的药物添加至上述初步候选药物列表,生成候选药物列表。
32.在一种可能的实施方式中,上述与上述靶向蛋白列表中的靶向蛋白互作药物是从drugbank数据库和ctd储存库中提取的。
33.在一种可能的实施方式中,上述将应用于其他疾病的药物添加至上述初步候选药物列表是基于矩阵三因子算法进行的。
34.在一种可能的实施方式中,上述矩阵三因子包括疾病-基因、药物-靶标和蛋白质-蛋白质。
35.在一种可能的实施方式中,上述矩阵三因子算法应用的数据源包括diseaseontology、drugbank、string、generif和ttd。
36.在一种可能的实施方式中,上述预测模型构建优化模块,包括:模型构建子模块,用于提取肿瘤的相关通路,并将上述相关通路的调节反应转化为逻辑公式,构建药物响应预测模型;模型优化子模块,用于整合基因转录组的表达数据优化上述药物响应预测模型,并对上述药物响应预测模型dp节点和tp节点的值进行初始化设置。
37.在一种可能的实施方式中,上述肿瘤的相关通路是从kegg数据库中提取的。
38.在一种可能的实施方式中,上述模型优化子模块,包括:差异列表生成单元,用于从疾病数据库提取差异表达基因,生成差异表达基因列表;模型优化单元,用于基于上述差异表达基因的fc值确定基因上调或下调,优化上述药物响应预测模型;初始化设置单元,用于对上述药物响应预测模型dp节点和tp节点的值进行初始化设置。
39.在一种可能的实施方式中,上述差异表达基因为fc值大于2的基因。
40.在一种可能的实施方式中,还包括:基因丢弃单元,用于当上述差异表达基因在多个实验中上调和下调的次数相等时,则丢弃上述差异表达基因。
41.在一种可能的实施方式中,上述最佳组合获取模块,包括:转化子模块,用于计算上述药物响应预测模型其它节点的值,并将上述药物响应预测模型转化为ode;组合列表生成子模块,用于基于上述ode分析上述候选药物列表中的药物-药物间联合使用效果,生成药物组合列表;最佳组合推荐子模块,用于定义effect指数为上述药物组合列表中的药物组合进行评分,推荐最佳药物组合。
42.在一种可能的实施方式中,上述其它节点为上述药物响应预测模型中除dp节点和tp节点以外的节点。
43.(三)有益效果本技术公开的基于数据集成的肿瘤跨适应症联合用药方法及系统,通过集成多种数据,以及开发新颖的生物信息学流程,将基于网络的模型应用到生信分析流程中,识别肿瘤潜在的多靶点疗法以及实现其跨适应症联合用药的推荐。
附图说明
44.以下参考附图描述的实施例是示例性的,旨在用于解释和说明本技术,而不能理解为对本技术的保护范围的限制。
45.图1是本技术公开的基于数据集成的肿瘤跨适应症联合用药推荐方法的流程示意图。
46.图2是本技术公开的基于数据集成的肿瘤跨适应症联合用药推荐系统的结构框图。
具体实施方式
47.为使本技术实施的目的、技术方案和优点更加清楚,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行更加详细的描述。
48.下面参考图1详细描述本技术公开的基于数据集成的肿瘤跨适应症联合用药方法实施例。如图1所示,本实施例公开的方法主要包括有以下步骤s100至s400。
49.s100,获取肿瘤的靶向蛋白列表;其中,s100包括s110-s120。
50.s110,构建肿瘤的特异ppi网络,并筛选若干个潜在靶向蛋白;其中,s110包括s111-s114。
51.s111,筛选肿瘤相关基因,生成相关基因列表;具体的,对于既定的肿瘤类型/亚型,均具有若干相关基因,基于现有知识,包括现有数据库或已发表的文章等,筛选肿瘤相关基因,肿瘤相关基因即为显著突变且在肿瘤中显著差异化表达的基因,将筛选的若干肿瘤相关基因生成相关基因列表。
52.s112,获取上述相关基因列表中各基因的相关编码蛋白质;具体的,对上述相关基因列表中的若干相关基因,出其编码的蛋白质,作为相关编码蛋白质。
53.s113,获取与上述相关编码蛋白质互作的蛋白质,构建肿瘤的特异ppi网络;其中,string数据库其中是一个蛋白质之间相互作用分析的数据库,该数据库收录多种物种,多种蛋白质以及多个蛋白质与蛋白质相互作用信息,蛋白质相互作用信息即包括直接的物理作用,也包括间接的功能相关性。
54.ppi网络即蛋白质互作网络(protein-protein interaction networks),蛋白质互作网络是由单独蛋白通过彼此之间的相互作用构成,来参与生物信号传递、基因表达调节、能量和物质代谢及细胞周期调控等生命过程的各个环节。系统分析大量蛋白在生物系统中的相互作用关系,对于了解生物系统中蛋白质的工作原理,了解疾病等特殊生理状态下生物信号和能量物质代谢的反应机制,以及了解蛋白之间的功能联系都有重要意义。
55.具体的,获取相关编码蛋白质后,基于string数据库筛选与相关编码蛋白质互作的其他相关蛋白质。以编码蛋白质以及获取的其他相关蛋白质作为节点,以string数据库中蛋白质与蛋白质之间的互作关系作为边线,构建ppi网络。
56.s114,选择上述肿瘤的特异ppi网络的部分桥接蛋白节点,并对上述桥接蛋白节点进行过滤,获取若干个潜在靶向蛋白;具体的,s114包括s1141-s1142。
57.s1141,对上述肿瘤特异的ppi网络进行节点度值排序,选择前20%的桥接蛋白节点;其中,节点度是指图结构中,和该节点相关联的边的条数,又称关联度,对于有向图,节点的入度是指进入该节点的边的条数;节点的出度是指从节点触发的边的条数。
58.具体的,对ppi网络中的若干个节点(蛋白质)按照节点度值排序,即基于该节点相关的边的条数进行排序。选择排在前20%的桥接蛋白节点。
59.s1142,利用stich数据库和drugbank数据库对上述前20%的桥接蛋白节点进行过滤,获取若干个潜在靶向蛋白;其中,stich数据库是基因和化学物质相互作用预测数据库,用来预测化学物质和基因之间的相互作用关系。
60.drugbank数据库是阿尔伯塔大学提供的一个生物信息学和化学信息学数据库,是一种独特的生物信息学和化学信息学资源,它将详细的药物数据和全面的药物目标信息结合起来。
61.随后再利用stich数据库和drugbank数据库对上述前20%的桥接蛋白节点进行过滤,从中筛选出具有高作用系数的桥接蛋白节点作为可物蛋白,即潜在靶向蛋白。
62.s120,对上述潜在靶向蛋白的目标组合进行评分,生成靶向蛋白列表;其中,s120包括s121-s122。
63.s121,计算上述潜在靶向蛋白的目标组合的tsds评分和空间分布;具体的,计算每个潜在靶向蛋白的三种可能靶标组合的tsds评分,并计算空间分布,以获取重要的tsds蛋白(p值《0.01),获取具有显著tsds评分的潜在靶向蛋白。
64.s122,基于上述tsds评分和上述空间分布选取评分大于零的潜在靶向蛋白,生成靶向蛋白列表。
65.s200,基于上述靶向蛋白列表生成候选药物列表;其中,s200包括s210
‑ꢀ
s220。
66.s210,提取与上述靶向蛋白列表中的靶向蛋白互作的药物,生成初步候选药物列表;其中,drugbank数据库是阿尔伯塔大学将详细的药物数据和全面的药物目标信息结合起来,真实可靠地生物信息学和化学信息学数据库。
67.ctd储存库即comparative toxicogenomics database数据库,整合大量化学物质、基因、功能表型和疾病之间的相互作用数据。
68.具体的,从drugbank数据库和ctd储存库中提取与上述靶向蛋白列表中的靶向蛋白互作的药物,基于上述提取的药物生成初步候选药物列表。
69.s220将应用于其他疾病的药物添加至上述初步候选药物列表,生成候选药物列表;具体的,基于矩阵三因子算法将应用于其他疾病的药物添加至上述初步候选药物列表,更新上述初步候选药物列表,生成候选药物列表。其中,矩阵三因子包括疾病-基因、药物-靶标、蛋白质-蛋白质,矩阵三因子算法应用的数据来源包括diseaseontology、drugbank、string、generif和ttd。
70.s300,构建并优化药物响应预测模型;其中,s300包括s310-s320。
71.s310,提取肿瘤的相关通路,并将上述相关通路的调节反应转化为逻辑公式,构建药物响应预测模型;具体的,从kegg数据库中提取肿瘤的相关通路,解析相关通路的kegg kgml文件,将相关通路的调节反应转化为逻辑公式,构建药物响应预测模型。
72.s320,整合基因转录组的表达数据优化上述药物响应预测模型,并,对上述药物响应预测模型dp节点和tp节点的值进行初始化设置;其中,s320包括s311-s313。
73.s311,从疾病数据库提取差异表达基因,生成差异表达基因列表;其中,fc为fold-change,即差异倍数。
74.具体的,选取fc值大于2的基因为差异表达基因,即为疾病相关基因,提取若干个上述差异表达基因,生成差异表达基因列表。
75.s312,基于上述差异表达基因的fc值确定基因上调或下调,优化上述药物响应预测模型;需要说明的是:当上述差异表达基因在多个实验中上调和下调的次数相等时,则丢弃上述差异表达基因。
76.s313,对上述药物响应预测模型dp节点和tp节点的值进行初始化设置。
77.s400,基于上述药物响应预测模型推荐上述候选药物列表中的最佳药物组合;其中,s400包括s410-s430。
78.s410,计算上述药物响应预测模型其它节点的值,并将上述药物响应预测模型转化为ode;s420,基于上述ode分析上述候选药物列表中的药物-药物间联合使用效果,生成药物组合列表;s430,定义effect指数为上述药物组合列表中的药物组合进行评分,推荐最佳药物组合;其中,上述其它节点为上述药物响应预测模型中除dp节点和tp节点以外的节点。
79.最后,可以通过分析结果并考虑疾病途径中常规疾病相关节点(dn)的数量,获得在体外实验中应检测的dp的排名列表(检测基因列表)。并通过检测在不同药物作用下确定基因 panel 的表达,以验证该方法得出的潜在药物候选组合疗法的有效性。
80.下面参考图2详细描述本技术公开的基于数据集成的肿瘤跨适应症联合用药推荐系统实施例。如图2所示,本实施例公开的系统包括:靶向蛋白列表获取模块201,用于获取肿瘤的靶向蛋白列表;候选药物列表生成模块202,用于基于上述靶向蛋白列表生成候选药物列表;预测模型构建优化模块203,用于构建并优化药物响应预测模型;最佳组合推荐模块204,用于基于上述药物响应预测模型推荐上述候选药物列表中的最佳药物组合。
81.在一种实施方式中,上述靶向蛋白列表获取模块201包括:ppi网络构建子模块,用于构建肿瘤的特异ppi网络,并筛选若干个潜在靶向蛋白;靶向蛋白列表获取子模块,用于对上述潜在靶向蛋白的目标组合进行评分,生成靶向蛋白列表。
82.在一种实施方式中,上述ppi网络构建子模块,包括:相关基因列表生成单元,用于筛选肿瘤相关基因,生成相关基因列表;编码蛋白质获取单元,用于获取上述相关基因列表中各基因的相关编码蛋白质;ppi网络构建单元,用于获取与上述相关编码蛋白质互作的蛋白质,构建肿瘤的特异ppi网络;潜在靶向蛋白获取单元,用于选择上述肿瘤的特异ppi网络的部分桥接蛋白节点,并对上述桥接蛋白节点进行过滤,获取若干个潜在靶向蛋白。
83.在一种实施方式中,上述肿瘤相关基因为显著突变且在肿瘤中显著差异化表达的基因。
84.在一种实施方式中,上述与上述相关编码蛋白质互作的蛋白质是从string数据库中筛选的。
85.在一种实施方式中,所潜在靶向蛋白获取单元,包括:排序选择子单元,用于对上述肿瘤特异的ppi网络进行节点度值排序,选择前20%的桥接蛋白节点;过滤子单元,用于利用stich数据库和drugbank数据库对上述前20%的桥接蛋白节点进行过滤,获取若干个潜在靶向蛋白。
86.在一种实施方式中,上述靶向蛋白列表获取子模块,包括:评分计算单元,用于计算上述潜在靶向蛋白的目标组合的tsds评分和空间分布;靶向蛋白列表获取单元,用于基于上述tsds评分和上述空间分布选取评分大于零的潜在靶向蛋白,生成靶向蛋白列表。
87.在一种实施方式中,上述候选药物列表生成模块202,包括:初步候选药物列表子模块,用于提取与上述靶向蛋白列表中的靶向蛋白互作的药物,生成初步候选药物列表;候选药物列表生成子模块,用于将应用于其他疾病的药物添加至上述初步候选药物列表,生成候选药物列表。
88.在一种实施方式中,上述与上述靶向蛋白列表中的靶向蛋白互作药物是从drugbank数据库和ctd储存库中提取的。
89.在一种实施方式中,上述将应用于其他疾病的药物添加至上述初步候选药物列表是基于矩阵三因子算法进行的。
90.在一种实施方式中,上述矩阵三因子包括疾病-基因、药物-靶标和蛋白质-蛋白质。
91.在一种实施方式中,上述矩阵三因子算法应用的数据源包括diseaseontology、drugbank、string、generif和ttd。
92.在一种实施方式中,上述预测模型构建优化模块203,包括:模型构建子模块,用于提取肿瘤的相关通路,并将上述相关通路的调节反应转化为逻辑公式,构建药物响应预测模型;模型优化子模块,用于整合基因转录组的表达数据优化上述药物响应预测模型,并对上述药物响应预测模型dp节点和tp节点的值进行初始化设置。
93.在一种实施方式中,上述肿瘤的相关通路是从kegg数据库中提取的。
94.在一种实施方式中,上述模型优化子模块,包括:差异列表生成单元,用于从疾病数据库提取差异表达基因,生成差异表达基因列表;模型优化单元,用于基于上述差异表达基因的fc值确定基因上调或下调,优化上述药物响应预测模型;初始化设置单元,用于对上述药物响应预测模型dp节点和tp节点的值进行初始化设置。
95.在一种实施方式中,上述差异表达基因为fc值大于2的基因。
96.在一种可能的实施方式中,还包括:基因丢弃单元,用于当上述差异表达基因在多个实验中上调和下调的次数相等时,则丢弃上述差异表达基因。
97.在一种实施方式中,上述最佳组合获取模块204,包括:转化子模块,用于计算上述药物响应预测模型其它节点的值,并将上述药物响应预测模型转化为ode;组合列表生成子模块,用于基于上述ode分析上述候选药物列表中的药物-药物间联合使用效果,生成药物组合列表;最佳组合推荐子模块,用于定义effect指数为上述药物组合列表中的药物组合进行评分,推荐最佳药物组合。
98.在一种实施方式中,上述其它节点为上述药物响应预测模型中除dp节点和tp节点以外的节点。
99.在本技术的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,均仅是为了便于描述本技术和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本技术保护范围的限制。
100.在本文中,“第一”、“第二”等仅用于彼此的区分,而非表示它们的重要程度及顺序等。
101.本文中的模块、单元或组件的划分仅仅是一种逻辑功能的划分,在实际实现时可以有其他的划分方式,例如多个模块和/或单元可以结合或集成于另一个系统中。作为分离部件说明的模块、单元、组件在物理上可以是分开的,也可以是不分开的。作为单元显示的部件可以是物理单元,也可以不是物理单元,即可以位于一个具体地方,也可以分布到网格单元中。因此可以根据实际需要选择其中的部分或全部的单元来实现实施例的方案。
102.以上所述,仅为本技术的具体实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应以上述权利要求的保护范围为准。

技术特征:


1.基于数据集成的肿瘤跨适应症联合用药推荐方法,其特征在于,包括:获取肿瘤的靶向蛋白列表;基于所述靶向蛋白列表生成候选药物列表;构建并优化药物响应预测模型;基于所述药物响应预测模型推荐所述候选药物列表中的最佳药物组合。2.如权利要求1所述的基于数据集成的肿瘤跨适应症联合用药推荐方法,其特征在于,所述获取肿瘤的靶向蛋白列表,包括:构建肿瘤的特异ppi网络,并筛选若干个潜在靶向蛋白;对所述潜在靶向蛋白的目标组合进行评分,生成靶向蛋白列表。3.如权利要求2所述的基于数据集成的肿瘤跨适应症联合用药推荐方法,其特征在于,所述构建肿瘤的特异ppi网络,并筛选若干个潜在靶向蛋白,包括:筛选肿瘤相关基因,生成相关基因列表;获取所述相关基因列表中各基因的相关编码蛋白质;获取与所述相关编码蛋白质互作的蛋白质,构建肿瘤的特异ppi网络;选择所述肿瘤的特异ppi网络的部分桥接蛋白节点,并对所述桥接蛋白节点进行过滤,获取若干个潜在靶向蛋白。4.如权利要求3所述的基于数据集成的肿瘤跨适应症联合用药推荐方法,其特征在于,所述肿瘤相关基因为显著突变且在肿瘤中显著差异化表达的基因。5.如权利要求3所述的基于数据集成的肿瘤跨适应症联合用药推荐方法,其特征在于,所述与所述相关编码蛋白质互作的蛋白质是从string数据库中筛选的。6.如权利要求3所述的基于数据集成的肿瘤跨适应症联合用药推荐方法,其特征在于,所述选择所述肿瘤的特异ppi网络的部分桥接蛋白节点,并对所述桥接蛋白节点进行过滤,获取若干个潜在靶向蛋白,包括:对所述肿瘤特异的ppi网络进行节点度值排序,选择前20%的桥接蛋白节点;利用stich数据库和drugbank数据库对所述前20%的桥接蛋白节点进行过滤,获取若干个潜在靶向蛋白。7.如权利要求2所述的基于数据集成的肿瘤跨适应症联合用药推荐方法,其特征在于,所述对所述潜在靶向蛋白的目标组合进行评分,生成靶向蛋白列表,包括:计算所述潜在靶向蛋白的目标组合的tsds评分和空间分布;基于所述tsds评分和所述空间分布选取评分大于零的潜在靶向蛋白,生成靶向蛋白列表。8.如权利要求1所述的基于数据集成的肿瘤跨适应症联合用药推荐方法,其特征在于,所述基于所述靶向蛋白列表生成候选药物列表,包括:提取与所述靶向蛋白列表中的靶向蛋白互作的药物,生成初步候选药物列表;将应用于其他疾病的药物添加至所述初步候选药物列表,生成候选药物列表。9.如权利要求8所述的基于数据集成的肿瘤跨适应症联合用药推荐方法,其特征在于,所述与所述靶向蛋白列表中的靶向蛋白互作的药物是从drugbank数据库和ctd储存库中提取的。10.如权利要求8所述的基于数据集成的肿瘤跨适应症联合用药推荐方法,其特征在
于,所述将应用于其他疾病的药物添加至所述初步候选药物列表是基于矩阵三因子算法进行的。11.如权利要求10所述的基于数据集成的肿瘤跨适应症联合用药推荐方法,其特征在于,所述矩阵三因子包括疾病-基因、药物-靶标和蛋白质-蛋白质。12.如权利要求10所述的基于数据集成的肿瘤跨适应症联合用药推荐方法,其特征在于,所述矩阵三因子算法应用的数据源包括diseaseontology、drugbank、string、generif和ttd。13.如权利要求1所述的基于数据集成的肿瘤跨适应症联合用药推荐方法,其特征在于,所述构建并优化药物响应预测模型,包括:提取肿瘤的相关通路,并将所述相关通路的调节反应转化为逻辑公式,构建药物响应预测模型;整合基因转录组的表达数据优化所述药物响应预测模型,并对所述药物响应预测模型dp节点和tp节点的值进行初始化设置。14.如权利要求13所述的基于数据集成的肿瘤跨适应症联合用药推荐方法,其特征在于,所述肿瘤的相关通路是从kegg数据库中提取的。15.如权利要求13所述的基于数据集成的肿瘤跨适应症联合用药推荐方法,其特征在于,所述整合基因转录组的表达数据优化所述药物响应预测模型,具体为:从疾病数据库提取差异表达基因,生成差异表达基因列表;基于所述差异表达基因的fc值确定基因上调或下调,优化所述药物响应预测模型。16.如权利要求15所述的基于数据集成的肿瘤跨适应症联合用药推荐方法,其特征在于,所述差异表达基因为fc值大于2的基因。17.如权利要求15所述的基于数据集成的肿瘤跨适应症联合用药推荐方法,其特征在于,当所述差异表达基因在多个实验中上调和下调的次数相等时,则丢弃所述差异表达基因。18.如权利要求1所述的基于数据集成的肿瘤跨适应症联合用药推荐方法,其特征在于,基于所述药物响应预测模型推荐所述候选药物列表中的最佳药物组合,包括:计算所述药物响应预测模型其它节点的值,并将所述药物响应预测模型转化为ode;基于所述ode分析所述候选药物列表中的药物-药物间联合使用效果,生成药物组合列表;定义effect指数为所述药物组合列表中的药物组合进行评分,推荐最佳药物组合。19.如权利要求18所述的基于数据集成的肿瘤跨适应症联合用药推荐方法,其特征在于,所述其它节点为所述药物响应预测模型中除dp节点和tp节点以外的节点。20.基于数据集成的肿瘤跨适应症联合用药推荐系统,其特征在于,包括:靶向蛋白列表获取模块,用于获取肿瘤的靶向蛋白列表;候选药物列表生成模块,用于基于所述靶向蛋白列表生成候选药物列表;预测模型构建优化模块,用于构建并优化药物响应预测模型;最佳组合推荐模块,用于基于所述药物响应预测模型推荐所述候选药物列表中的最佳药物组合。21.如权利要求20所述的基于数据集成的肿瘤跨适应症联合用药推荐系统,其特征在
于,所述靶向蛋白列表获取模块包括:ppi网络构建子模块,用于构建肿瘤的特异ppi网络,并筛选若干个潜在靶向蛋白;靶向蛋白列表获取子模块,用于对所述潜在靶向蛋白的目标组合进行评分,生成靶向蛋白列表。22.如权利要求21所述的基于数据集成的肿瘤跨适应症联合用药推荐系统,其特征在于,所述ppi网络构建子模块,包括:相关基因列表生成单元,用于筛选肿瘤相关基因,生成相关基因列表;编码蛋白质获取单元,用于获取所述相关基因列表中各基因的相关编码蛋白质;ppi网络构建单元,用于获取与所述相关编码蛋白质互作的蛋白质,构建肿瘤的特异ppi网络;潜在靶向蛋白获取单元,用于选择所述肿瘤的特异ppi网络的部分桥接蛋白节点,并对所述桥接蛋白节点进行过滤,获取若干个潜在靶向蛋白。23.如权利要求22所述的基于数据集成的肿瘤跨适应症联合用药推荐系统,其特征在于,所述肿瘤相关基因为显著突变且在肿瘤中显著差异化表达的基因。24.如权利要求22所述的基于数据集成的肿瘤跨适应症联合用药推荐系统,其特征在于,所述与所述相关编码蛋白质互作的蛋白质是从string数据库中筛选的。25.如权利要求22所述的基于数据集成的肿瘤跨适应症联合用药推荐系统,其特征在于,所潜在靶向蛋白获取单元,包括:排序选择子单元,用于对所述肿瘤特异的ppi网络进行节点度值排序,选择前20%的桥接蛋白节点;过滤子单元,用于利用stich数据库和drugbank数据库对所述前20%的桥接蛋白节点进行过滤,获取若干个潜在靶向蛋白。26.如权利要求21所述的基于数据集成的肿瘤跨适应症联合用药推荐系统,其特征在于,所述靶向蛋白列表获取子模块,包括:评分计算单元,用于计算所述潜在靶向蛋白的目标组合的tsds评分和空间分布;靶向蛋白列表获取单元,用于基于所述tsds评分和所述空间分布选取评分大于零的潜在靶向蛋白,生成靶向蛋白列表。27.如权利要求20所述的基于数据集成的肿瘤跨适应症联合用药推荐系统,其特征在于,所述候选药物列表生成模块,包括:初步候选药物列表子模块,用于提取与所述靶向蛋白列表中的靶向蛋白互作的药物,生成初步候选药物列表;候选药物列表生成子模块,用于将应用于其他疾病的药物添加至所述初步候选药物列表,生成候选药物列表。28.如权利要求27所述的基于数据集成的肿瘤跨适应症联合用药推荐系统,其特征在于,所述与所述靶向蛋白列表中的靶向蛋白互作药物是从drugbank数据库和ctd储存库中提取的。29.如权利要求27所述的基于数据集成的肿瘤跨适应症联合用药推荐系统,其特征在于,所述将应用于其他疾病的药物添加至所述初步候选药物列表是基于矩阵三因子算法进行的。
30.如权利要求29所述的基于数据集成的肿瘤跨适应症联合用药推荐系统,其特征在于,所述矩阵三因子包括疾病-基因、药物-靶标和蛋白质-蛋白质。31.如权利要求29所述的基于数据集成的肿瘤跨适应症联合用药推荐系统,其特征在于,所述矩阵三因子算法应用的数据源包括diseaseontology、drugbank、string、generif和ttd。32.如权利要求20所述的基于数据集成的肿瘤跨适应症联合用药推荐系统,其特征在于,所述预测模型构建优化模块,包括:模型构建子模块,用于提取肿瘤的相关通路,并将所述相关通路的调节反应转化为逻辑公式,构建药物响应预测模型;模型优化子模块,用于整合基因转录组的表达数据优化所述药物响应预测模型,并对所述药物响应预测模型dp节点和tp节点的值进行初始化设置。33.如权利要求32所述的基于数据集成的肿瘤跨适应症联合用药推荐系统,其特征在于,所述肿瘤的相关通路是从kegg数据库中提取的。34.如权利要求32所述的基于数据集成的肿瘤跨适应症联合用药推荐系统,其特征在于,所述模型优化子模块,包括:差异列表生成单元,用于从疾病数据库提取差异表达基因,生成差异表达基因列表;模型优化单元,用于基于所述差异表达基因的fc值确定基因上调或下调,优化所述药物响应预测模型;初始化设置单元,用于对所述药物响应预测模型dp节点和tp节点的值进行初始化设置。35.如权利要求34所述的基于数据集成的肿瘤跨适应症联合用药推荐系统,其特征在于,所述差异表达基因为fc值大于2的基因。36.如权利要求34所述的基于数据集成的肿瘤跨适应症联合用药推荐系统,其特征在于,还包括:基因丢弃单元,用于当所述差异表达基因在多个实验中上调和下调的次数相等时,则丢弃所述差异表达基因。37.如权利要求20所述的基于数据集成的肿瘤跨适应症联合用药推荐系统,其特征在于,所述最佳组合推荐模块,包括:转化子模块,用于计算所述药物响应预测模型其它节点的值,并将所述药物响应预测模型转化为ode;组合列表生成子模块,用于基于所述ode分析所述候选药物列表中的药物-药物间联合使用效果,生成药物组合列表;最佳组合推荐子模块,用于定义effect指数为所述药物组合列表中的药物组合进行评分,推荐最佳药物组合。38.如权利要求37所述的基于数据集成的肿瘤跨适应症联合用药推荐系统,其特征在于,所述其它节点为所述药物响应预测模型中除dp节点和tp节点以外的节点。

技术总结


本申请公开了一种基于数据集成的肿瘤跨适应症联合用药推荐方法和系统,涉及生物信息学领域,首先获取肿瘤的靶向蛋白列表,基于靶向蛋白列表生成候选药物列表,构建并优化药物响应预测模型,最后基于药物响应预测模型推荐所述候选药物列表中的最佳药物组合。本申请公开的基于数据集成的肿瘤跨适应症联合用药方法及系统,通过集成多种数据,以及开发新颖的生物信息学流程,将基于网络的模型应用到生信分析流程中,识别肿瘤潜在的多靶点疗法以及实现其跨适应症联合用药的推荐。现其跨适应症联合用药的推荐。现其跨适应症联合用药的推荐。


技术研发人员:

赵再戌 安琪儿 闵浩巍 郭栋梁

受保护的技术使用者:

神州医疗科技股份有限公司

技术研发日:

2022.11.14

技术公布日:

2022/12/12

本文发布于:2024-09-22 19:44:17,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/33727.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:药物   靶向   所述   蛋白
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议