生物信息学分析胰腺癌组织关键基因表达及其意义

  基金项目:国家自然科学基金资助项目(81960516)
作者单位:
730000 兰州大学第一临床医学院、兰州大学第一医院通讯作者:朱克祥,:flexzhu6910@sina.com
生物信息学分析胰腺癌组织关键基因表达及其意义
王乾合 赵立然 朱克祥
摘 要 目的 利用生物信息学方法对GEO数据库进行探索,获取胰腺癌发生、发展的核心基因,分析胰腺癌发生、发展的潜在机制。方法 使用GEOquery包从GEO数据库获取胰腺癌相关芯片数据(GSE62452),利用Limma包进行差异分析,结合clustreProfiler包对上调基因和下调基因分别进行GO功能和KEGG通路分析,利用String在线网站对差异基因进行蛋白互作网络分析,利用Cystoscopes软件筛选出核心基因,最后借助TCGA数据库和芯片数据(GSE28735)对核心基因进行再次验证。结果利用生物信息学方法共获得286个差异基因,其中包含上调基因189个,下调基因97个。富集分析结果显示上调基因涉及细胞组织黏附、细胞外基质组织构成等功能以及蛋白消化与吸收、PI3K-Akt等信号通
路相关。下调基因与脂类消化、细胞壁破裂等功能和胰腺分泌等信号通路密切相关。通过蛋白互作网络筛选出20个关键基因,利用GEPIA数据库对关键基因进行生存分析验证,发现3个基因(MMP11、LAMB3、PLAU)与胰腺癌预后明显相关。结论 通过生物信息学方法最终筛选出3个核心基因,为胰腺癌的诊断和预后提供了新的思路。
关键词 胰腺癌 靶向 GEO
中图分类号 R73    文献标识码 A    DOI 10.11969/j.issn.1673 548X.2021.05.009
ExpressionandSignificanceofKeyGenesinPancreaticCancerTissues:ABioinformaticsAnalysis. WangQianhe,ZhaoLiran,ZhuKex iang.TheFirstClinicalMedicalCollege,LanzhouUniversity,TheFirstHospitalofLanzhouUniversity,Gansu730000,China
Abstract Objective Geneexpressionomnibus(GEO)databaseswasanalyzedbyusingbioinformaticstoscreenthekeygenes,andtoanalyzethepotentialm
echanismsofpancreaticcancer.Methods MicroarraydataofGSE62452wereobtainedfromGEOdatabasesusingGEOquerypackageanddifferentiallyexpressedgeneswerescreenedusingLimmapackage.WiththeclustreProfilerpackage,GOfunctionandKEGGpathwayanalysiswerecarriedoutforup-regulatedgenesanddown-regulatedgenesrespectively.ProteininteractionnetworkanalysisofdifferentiallyexpressedgeneswasanalyzedusingStringonlinewebsites,andCystoscopessoftwarewasusedtoscreencoregenes.Finally,thecoregeneswereverifiedwithTCGAdatabaseandchipdata(GSE28735).Results Atotalof286differentiallyexpressedgeneswereextractedbybioinformatics,including189up-regulatedgenesand97down-regulatedgenes.Enrichmentanalysisrevealedthatupregulatedgeneswerecloselyassociatedwiththefunctionandpathwayenrichme
ntsuchascellulartissueadhesion,extra cellularmatrixtissuecomposition,proteindigestionandabsorption,andPI3K-Aktsignalingpathways.Down-regulatedgenesareclose lyrelatedtolipiddigestion,cellwallruptureandpancreaticsecretionsignalingpathways.Twentycoregeneswerescreenedusingthepro teininteractionnetwork,andsurvivalanalysisofkeygeneswereperformedusingtheGEPIAdatabase.Wefoundthatthreegenes(MMP11,LAMB3,PLAU)weresignificantlycorrelatedwiththeprognosisofpancreaticcancer.Conclusion Threecoregeneswerese lectedbybioinformaticsmethod,whichprovidedanewideaforthediagnosisandprognosisofpancreaticcancer.
Keywords Pancreaticcancer;Targetedtherapy;GEO
  胰腺癌(pancreaticcarcinoma)是一种恶性程度极高的消化道肿瘤,在恶性肿瘤中是导致癌症相关死亡的第3大原因。此外,胰腺癌的发生率正在逐年上升,据统计2019年在美国因胰腺癌而死亡人数为45750例
[1]
。欧盟癌症数据库统计结果显示,胰腺癌
在所有恶性肿瘤的发生率中排名第7位,病死率排名
第4位,
发生率与病死率大致相同,5年生存率不足8%[2]
。胰腺癌早期患者通常无明显症状,这一特征
对胰腺癌的早期诊断造成了一定程度的困难。据统计只有约1
0%的胰腺癌患者能够接受手术,但是术后易复发和转移,患者5年生存率仅为25%。近年来胰腺癌的方案有了很大的改进,但由于患者的个体差异,其预后的敏感度和特异性仍不尽如人意。糖类抗原1
9-9(CA19-9)是胰腺腺癌临床诊断和监测中最常用和最有效的血清肿瘤标志物。其诊断胰腺癌的特异性和敏感度分别为46%~98%
  医学研究杂志 2021年5月 第50卷 第5期
·论  著· 
和69%~93%[3]。因此,研究胰腺癌的病理机制,寻早期检测标志物,提高胰腺癌患者的生存时间和预后迫在眉睫。
生物信息学作为一门新的学科,它是把基因组DNA序列信息分析作为源头,在获得蛋白质编码区的信息后进行蛋白质空间结构模拟和预测,然后依据特定蛋白质的功能进行必要的药物设计。本研究结合人类肿瘤相关的基因表达汇编(geneexpressionomnibus,GEO)数据库,筛选差异基因并进行深入分析,为胰腺癌的发生、发展提供理论依据。
材料与方法
1.数据来源:从GEO数据库(https:∥www.ncbi.nlm.nih.gov/gds/)获取胰腺癌的表达谱芯片(GSE62452),该数据集为全基因组mRNA表达芯片,其包含69例癌组织样本,61例癌旁组织样本。
2.数据处理:使用GEOquery包从GEO数据库获取胰腺癌相关芯片数据(GSE62452),利用Limma包进行差异分析,差异基因阈值设为|log(foldchange)|>1且P<0.01。
3.差异基因的富集分析:使用R语言的clus treProfiler包对上调基因和下调基因进行KEGG(kyo toencyclopediaofgenesandgenomes)、GO(geneontol ogy)富集分析,以P<0.05作为纳入标准。
4.蛋白互作网络分析:将差异基因导入STRING(https:∥stringdb.org/)在线分析网站构建蛋白互作网络(protein-proteininteraction,PPI),以combinedscore≥0.4为纳入标准。将所得结果导入Cytoscape软件进行可视化分析,并进一步筛选关键基因。
5.关键基因生存分析:使用GEPIA(http:∥ge pia.cancer-pku.cn/)数据库对胰腺癌的关键基因在胰腺癌和正常组织中的表达进行再次验证,绘制Ka plan-Meier生存曲线探索关键基因表达高低与预后的关系。
结  果
1.差异基因筛选结果:通过对基因芯片GSE62452分析,以|log(foldchange)|>1且P<0 01为标准共得到286个显著差异基因,包含上调基因189个,下调基因97个。使用VolcanoPlot包绘制火山图(图1)。
2.差异基因富集分析:对上调和下调基因分别进行GO、KEGG分析,GO分析表明上调基因生物进程涉及细胞组织黏附、细胞外基质组织构成等功能,下调基因与脂类消化、细胞壁破裂等功能密切相关(表1)
图1 差异基因火山图
FC.两组间基因差异表达倍数
表1 胰腺癌组织差异基因GO富集分析结果GO编码富集类型数目变化
GO:0030198细胞外基质组织44上调
这颗薰衣草爱吃栗子GO:0043062细胞外结构组织44上调客户经理制
GO:0031589细胞基质黏附24上调
GO:0044278细胞壁破裂4下调
GO:0007586消化8下调
GO:0044241脂类的消化4下调
  P均为0.000
  KEGG通路富集分析结果显示,上调基因主要涉及蛋白消化与吸收、PI
K-Akt等信号通路(图3),下调基因主要与胰腺分泌等信号通路密切相关(图4、表2)。ECM-受体相互作用和胰腺分泌分别是上调基因和下调基因富集的主要通路(图5、图6)。
3.构建PPI网络:将差异基因导入STRING在线网站进行蛋白互作网络分析,所得结果导入Cyto scape软件筛选关键基因,最终得到20个关键基因(ITGB4、PLA2G1B、CTRC、CPB1、SYCN、ITGA2、ALB、CELA3B、PLAU、MMP11、LAMB3、PNLIP、CLPS、CPA1、ITGB6、PRSS3P2、LAMC2、LAMC3、MMP7、CPA2)。这些核心基因相互关联,可能在胰腺癌的发生、发展中发挥协同作用(图7)。富集分析结果表明,20个核心基因主要涉及ECM-受体相互作用、黏
着斑、PI
itg
K-Akt信号通路等。
4.生存分析及核心基因验证:利用GPEPIA数据库对20个关键基因进行验证。生存分析显示,MMP11、LAMB3以及PLAU与胰腺癌预后密切相关(图8),在芯片数据GSE28735分析45例胰腺癌组织和配对的癌旁正常组织对核心基因进行验证,在两个GEO数据集中,PLAU、MMP11及LAMB3在胰腺肿瘤组织中显著上调(表3)。
 ·论  著·JMedRes,May2021,Vol.50No.5 
图3 上调基因GO分析结果
FC.两组间基因差异表达倍数
图4 下调基因GO分析结果
表2 胰腺癌组织差异基因KEGG富集分析结果
KEGG编码富集类型
数目变化hsa04512细胞外基质受体相互作用
14上调hsa04510黏着斑
15上调hsa04974蛋白消化与吸收
10上调hsa04972胰腺分泌18下调hsa04974蛋白消化与吸收10下调hsa04975
脂肪消化与吸收
辣嫂
下调
  P均为0.000智能交通系统
讨  论
在美国,胰腺癌是癌症相关死亡的第4大原因,且发生率还在不断上升,预计到2030年将成为第2大常见恶性肿瘤[4]。胰腺癌的危险因素包含吸烟、家族史、慢性胰腺炎、年龄增长、男性、糖尿病、肥胖、非O血型、叶酸饮食以及幽门螺杆菌感染和牙周疾病[5]。近年来胰腺癌的诊断取得了allen试验
  医学研究杂志 2021年5月 第50卷 第5期
·论  著· 
图5 上调基因KEGG分析结果
图6 下调基因KEGG分析结果
一定程度的进步,超声内镜造影(CE-EUS)、EUS弹性成像或EUS引导下细针穿刺活检肿块均有助于检测发现早期胰腺癌,尤其是对于影像学无法识别的无症状胰腺肿块[6]。到目前为止,还没有针对胰腺癌的特异性生物学标志物。对于这种致命疾病的早期诊断,仍然需要新的、更敏感的生物学标志物。
本研究采用生物信息学方法对胰腺癌GSE62452芯片进行分析,共获得286个差异基因,其中包含上调基因189个,下调基因97个。GO和KEGG富集分析结果显示上调基因涉及细胞组织黏附、细胞外基质组织构成等功能以及蛋白消化与吸收、PI3K-Akt等信号通路相关。下调基因与脂类消化、细胞壁破裂等功能和胰腺分泌等信号通路密切相关。通过蛋白互作网络筛选出20个关键基因,利用GEPIA数据库对关键基因进行生存分析验证,显示基因MMP11、LAMB3及PLAU可能与胰腺癌的发生、发展密切相关。
 ·论  著·
JMedRes,May2021,Vol.50No.5 
图7 20个关键基因蛋白互作网络
黄图标代表上调基因,绿图标代表下调基因;
圆形图标代表20个关键基因
  纤溶酶原激活物尿激酶(PLAU)是一种丝氨酸蛋白酶,主要表达于内质网腔,在炎症与癌症进程中均发挥着重要作用,例如,能够调节细胞迁移、增殖、黏附,同样也参与肝脏、肌肉以及轴突再生。PLAU结合其受体PLAUR启动蛋白水解级联反应,将纤溶酶原转化为纤溶酶。P
LAU参与多种癌症中的发展,例如胃癌、结肠癌、胰腺癌。PLAU的活性也是乳腺癌和非小细胞肺癌预后和预测因素的生物学标志
物[7]
。研究结果显示,胰腺癌中PLAU表达明显上调[8]。本研究发现PLAU在胰腺癌中明显上调,与上
述文献结果一致,但有关PLAU在胰腺癌中的实验验证尚未见报道,需要开展进一步研究予以验证。
基质金属蛋白酶-1
1(matrixmetalloproteinase,MMP11)是MMP家族的一种蛋白水解酶,基质蛋白(
MMPs)是一种锌依赖性的内肽酶家族,
主要参与图8 生存曲线
A.MMP11总生存期;B.LAMB3总生存期;C.PLAU总生存期 
表3 胰腺癌中PLAU、MMP11及LAMB3
在两个数据集的差异表达
数据集基因名称logFCGSE62452PLAU1.3257GSE28735PLAU1.
8504GSE62452MMP111.2301GSE28735MMP111.1958GSE62452LAMB32.0896GSE28735
LAMB3
1.9632
  FC.两组间基因差异表达倍数;P均为0.000
细胞外基质降解和组织重塑。目前为止已经发现了24种哺乳动物基质金属蛋白酶,这些酶参与胚胎发育、血管生成、伤口愈合、细胞凋亡、排卵、神经生长等生理过程。其活性受天然组织特异性抑制剂蛋白(
TIMPS)的控制,MMPs与TIMPS的失衡与癌症的进展和转移密切相关,MMPs同样在骨关节炎、类风湿
关节炎、牙周病、肺气肿、皮肤溃疡、动脉粥样硬化、主动脉瘤以及中枢神经系统疾病中扮演着不可或缺的角。研究证实癌症相关成纤维细胞中的外泌体miRNA-139通过抑制MMP11表达抑制胃癌的进
展[9]。Eiro等[10]研究246例女性浸润性乳腺癌患者
显示,癌症相关成纤维细胞表达的MMP11是预测乳腺癌总生存期和无复发生存期最有效的独立因素。
Lee等[11]通过生物信息学分析得出MMP11可作为
胰腺癌患者预后标志物。
层粘连蛋白亚基β3(LAMB3)是编码组成LM-332的三聚体蛋白之一,由角质细胞分泌的细胞外基质蛋白,是基底层重要的生物活性成分,影响着细胞
分化、迁移和黏附以及细胞增殖和存活[
12]
。LM-332的α3、β3和γ2链分别由3个不同的基因LA MA3、LAMB3和LAMC2编码。LAMB3对于结肠、胰
  医学研究杂志 2021年5月 第50卷 第5期
·论  著· 

本文发布于:2024-09-20 17:26:07,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/693567.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:基因   胰腺癌   分析
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议