肿瘤CNV调控性ceRNA网络构建

肿瘤CNV调控性ceRNA网络构建
Identification of Dysregulated Competitive Endogenous RNA Networks Driven by Copy Number Variations in Malignant Gliomas恶性胶质瘤中受拷贝数变异驱动的异常调控的竞争性内源性RNA网络的识别
基因调控网络摘要:胶质瘤占恶性脑瘤的80%。由于异质性高,胶质瘤的致瘤机制尚不清楚。在本研究中,作者开发了一种新的方法来识别低级别胶质瘤(LGG)和多形性胶质瘤(GBM)中受拷贝数变异(CNV)驱动的竞争性内源性RNA (ceRNA)相互作用。通过分析来自癌症基因组图谱(TCGA)的基因组和转录组数据,本文首先发现了受CNV显著影响的蛋白质编码基因和长链非编码rna (lncRNAs),并通过定制的流程进一步确定CNV驱动的异常调控的 ceRNA相互作用。最终LGG中得到了13776对cnv驱动的异常调控的ceRNA对(包括3954个mrna和306个lncrna),GBM中262对(包括221个mrna和11个lncrna)。本文的结果表明,大多数的ceRNA相互作用在LGG和GBM中被CNV削弱,许多CNV驱动的基因在异常调控的ceRNA网络中共享相同的ceRNA。功能分析表明,CNV驱动的ceRNA网络参与了细胞周期、p53信号通路、TGF-beta信号通路等肿瘤发生的重要机制。进一步研究表明异常调控的ceRNA网络中的ceR
NA对揭示了与恶性胶质瘤的肿瘤发生相关的更详细的生物学功能。此外,通过探索CNV驱动的ceRNA与预后和组织学亚型的关系,作者发现MTAP、KLHL9和ELAVL2的拷贝数状态与LGG的总体生存相关,并与组织学亚型高度相关。总之,本研究为胶质瘤的分子机制和临床生物标志物的研究提供了新的思路。
方法:1.数据:从TCGA数据库(/tcga)下载LGG和GBM的DNA拷贝数(SNP 6.0)、mRNA和miRNA表达数据,从TANRIC下载lncRNA表达数据。作者提取了样本匹配的拷贝数变异数据和基因表达数据,包括435个LGG和152个GBM样本。对于DNA拷贝数数据,作者使用GISTIC2.0确定了LGG和GBM中基因的离散拷贝数的五个类型(-2,-1,0,1,2),并排除了10%以上样本中没有CNV的基因。基因表达值用log2(tpm+1)归一化,表达平均值低于30%或缺失值超过10%的基因被剔除。
2.CNV驱动的蛋白质编码基因和lncRNA的识别为了降低噪声的影响,作者使用GISTIC2.0保留了高水平的扩增和缺失,并对存在2和-2状态的基因使用二项式检验,样本量较小的拷贝数的状态被认为是噪音,拷贝数的状态被设置为0 (P < 0.05)或删除(P >=0.05)。然后,对于每个蛋白质编码基因或lncRNA,作者将基因表达数据按拷贝数状态进行分割,并对两
组进行秩和检验。拷贝数状态和基因表达一致变化的基因被认为是CNV驱动基因(P < 0.05)。 3.异常调控的受CNV驱动的ceRNA-ceRNA网络的识别作者开发了一种计算方法来识别异常调控的受CNV驱动的ceRNA-ceRNA相互作用,它包括以下步骤:(1)在每个拷贝数状态下获得ceRNA–ceRNA相互作用。mRNA-miRNA和lncRNA-miRNA的相互作用是从StarBase v2.0获得的。使用每种拷贝数状态(即扩增,缺失和正常)中的mRNA,lncRNA和miRNA的表达谱,作者计算了ceRNA对之间的皮尔逊相关系数(PCC)以及mRNA / lncRNA(ceRNA)和miRNA以进行测量它们的表达相关性。ceRNA对之前具有显著正相关性(调整后的p值<0.05),每个miRNA-ceRNA相互作用显示出显著负相关(调整的p值<0.05)被视为该状态下的候选ceRNA三元组。(2)计算拷贝数状态之间ceRNA调控的差异。作者假设由CNV引起的异常调控将影响每个候选ceRNA三元组中ceRNA相互作用之间的相关性。因此,作者将扩增/缺失样本中的ceRNA与正常样本的相关性进行了比较,以确定失调的程度。失调的程度定义为:
其中cor v(ceRNA1,ceRNA2)是从扩增/缺失样品估计的PCC,而cor n(ceRNA1,ce
RNA2)是从正常样品估计的。如果候选ceRNA三联体仅以一个拷贝数状态存在,则也使用之前过滤的相关性来计算ΔR。
(3)识别CNV驱动的ceRNA-ceRNA相互作用失调。为了确定ΔR是否在统计学上显着,进行了随机(permutation)检验。作者将拷贝数状态的标签随机化1000次,并重新计算每个ceRNA对的相关系数的变化。满足P值为0.05的互作对认为是CNV驱动的失调的ceRNA-ceRNA相互作用。R脚本在GitHub上可用(github/EmeraldG1996/orangejuice/tree/master/ceRNA-interaction)。
4.功能富集分析为了进行功能富集分析,首先获得了LGG / GBM的基因表达谱,并从TCGA获得了匹配的正常样品,并筛选了差异表达基因。基于倍数变化值,作者进行了基因集富集分析(GSEA),以发现分别在LGG和GBM中改变的基因的KEGG通路和GO功能。然后,使用超几何检验进一步确定ceRNA网络(参与了哪些与癌症相关的功能:
其中N是基因表达谱中的基因数量,n是参与ceRNA网络的给定基因数量,M是参与癌症相关KEGG通路/ GO功能的基因数量。
5.临床数据统计分析从cBioPortal (/)中下载432 LGG and 124 GBM患者的临床数据。通过Kaplan-Meier估计构建总体生存曲线,并使用对数秩检验(P <0.05)来确定与生存相关的显着拷贝数变化。Cox比例风险回归模型用于研究基因表达与OS之间的关系。进行Fisher精确检验,以检测与拷贝数变异的临床病理相关性。
结果1.识别LGG和GBM中的DNA拷贝数变异为了系统地评估LGG和GBM中的拷贝数变异(CNV),作者对TCGA SNP 6.0阵列数据执行了GISTIC2,以获取每个基因的拷贝数状态。在LGG中检测到85个假定的CNV,在GBM中检测到65个。作者将识别出的CNV分为两种类型,即扩增或缺失,以进行进一步分析。在大多数GBM患者中可见原癌基因的局部扩增。例如,在23例患者中发现了PDGFRA的扩增,分别有71例和28例患者显示了EGFR和CDK4的扩增。作者还发现一些患者具有肿瘤抑制基因的局灶性缺失,例如CDKN2A和CDKN2B。LGG上癌基因的扩增不如GBM广泛,但在LGG中也发现了CDKN2A / B的局部缺失,这被认为是神经胶质瘤中的负性细胞周期调节剂。

本文发布于:2024-09-21 18:48:45,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/388147.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:基因   作者   表达   数据   胶质瘤   驱动   状态   调控
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议