基于生物信息学途径筛选缺血性脑卒中关键基因及药物预测

第42卷第1期2021年1月
Vol.42No.1
January2021中山大学学报(医学科学版)
JOURNAL OF SUN YAT⁃SEN UNIVERSITY(MEDICAL SCIENCES)
基于生物信息学途径筛选缺血性脑卒中关键基因及药物预测
于瑜,王钟兴
(中山大学附属第一医院麻醉科,广东广州510080)
摘要:【目的】筛选缺血性脑卒中的关键基因及重要信号通路,预测可能对脑卒中有用的药物。【方法】从GEO数据库下载GSE98319基因芯片数据,该数据包含了假手术组、大脑中动脉梗塞组(MCAO)小鼠的基因芯片检测结果。用R语言的Limma包对数据进行差异表达分析,P<0.05且|log2FC|>0.6的基因为差异表达基因。借助STRING网站构建差异表达基因的蛋白质相互作用网络(PPIN)后由Cytoscape软件进行核心子网络筛选及可视化输出。筛选出核心基因后用实时荧光定量PCR(qRT-PCR)验证核心基因在脑缺血小鼠大脑皮层的表达情况。
基因集富集分析(GSEA)算法用于京都基因与基因组百科全书(KEGG)和基因本体(GO)富集分析,以FDR<0.05作为富集标准。最后用Connectivity Map数据库预测脑卒中的潜在作用药物。【结果】共筛出521个差异mRNA,其中421个上调、100个下调,其中2个关键基因Drd4(P=0.000019)和Hcar2(P=0.000094)经qRT-PCR实验证实在脑缺血后表达均升高。4种小分子化合物艾司洛尔(Esmolol)、甲巯咪唑(Methimazole)、吐根酚碱(Cephaeline)、水仙环素(Narciclasine)可能对缺血性卒中有作用。【结论】Drd4和Hcar2可能与缺血性卒中的发生发展密切相关。预测出的4种药物可为后续药物研究提供参考。
关键词:缺血性脑卒中;基因集富集分析;生物信息学;药物预测
中图分类号:R743.4文献标志码:A文章编号:1672-3554(2021)01-0042-09
Screening of Key Genes and Prediction of Drugs for Ischemic Stroke Based on Bioinformatics
Approach
YU Yu,WANG Zhong-xing
(Department of Anesthesiology,The First Affiliated Hospital of Sun Yat-sen University,Guangzhou510080,China)
Correspondence to:WANG Zhong-xing;E-mail:*****************
Abstract:【Objective】To screen out key genes and important signal pathways of ischemic stroke to predict potential drugs that might be useful for stroke.【Methods】We obtained GSE98319Microarray data from GEO database which contained sequencing results from control(Sham group)and experimental(middle cerebral artery occlusion,MCAO)mice.Limma package of R language was used to analyze Microarray data.Differentially expressed genes were selected with P<0.05and|log2FC|>0.6as the criteria.Protein-Protein Interaction Network(PPIN)of differentially expressed genes was constructed by STRING online website and visualized by Cytoscape software.Quantitative real-time polymerase chain reaction(qRT-PCR)was performed to testify hub genes expression level.Gene Set enrichment analysis(GSEA)algorithm was used in functional enrichment analysis of Kyoto Encyclopedia of Genes and Genomics(KEGG)and Gene Ontology (GO)with FDR<0.05as the enrichment standard.Finally,potential agents for stroke were predicted by Connectivity Map.【Results】A total of521differentially expressed genes were identified,421up-regulated and100down-regulated.
Two hub genes:Drd4(P=0.000019)and Hcar2(P=0.000094)expression level upregulated in stroke mice cortex validated by qRT-PCR.Finally,four small molecule compounds:Esmolol,Methi
mazole,Cephaeline and Narciclasine were
收稿日期:2020-12-03
基金项目:国家自然科学基金(81971877);广州市科技项目(201904010418)
作者简介:于瑜,硕士,研究方向:脑缺血再灌注损伤的保护,E-mail:****************;王钟兴,通信作者,博士研究生导师,主任医师,E-mail:*****************
第1期于瑜,等.基于生物信息学途径筛选缺血性脑卒中关键基因及药物预测predicted to have potential therapeutic effects on ischemic stroke.【Conclusions】Drd4and Hcar2may be closely related to the occurrence and development of ischemic stroke.Four potential therapeutic drugs are predicted,providing reference for the subsequent research on drug therapy.
Key words:ischemic stroke;GSEA;bioinformatics;drugs prediction
[J SUN Yat⁃sen Univ(Med Sci),2021,42(1):42-50]
脑卒中作为全球第二大死亡原因,严重危害人类健康。全球每年约有550万人死于脑卒中,每4个成年人中就有1人发病[1]。发病后遗留的身体残疾和神经功能障碍给中风幸存者的家庭及社会造成极大
负担。在脑卒中病例中,缺血性脑卒中(以下简称脑缺血)约占70%,是脑卒中的主要类型[1]。目前,临床上脑缺血的主要方法包括脑血管再通和神经保护。遗憾的是,这些措施收益有限。为了到更有效的方式以及靶点,许多科学家从遗传学角度出发,寻与脑缺血密切相关的基因,希望为提供更多选择。例如:有研究人员利用高通量组学技术发现CLDN20、GADD45G、
RGS2、BAG5和CTNND2可以作为小鼠和人类血液样本中脑缺血的血液生物标记物,协助脑缺血的临床诊断[2]。MAP2K4(丝裂原活化蛋白激酶4)是MAPK通路的重要枢纽,MAP2K4基因多态性rs3826392可能在脑缺血后的炎症反应中发挥调节作用[3]。这些从基因层面解读脑缺血病理生理过程的研究对方案的研发有一定启迪作用。因此,本研究借助生物信息学手段,通过对公共数据库的分析,寻对缺血性脑卒中有重要作用的基因及相关通路,希望到潜在药物,能为缺血性脑卒中的进一步研究和后续提供线索。
1材料与方法
1.1数据收集
大脑中动脉栓塞(middle cerebral artery occlu⁃sion,MCAO)是研究缺血性脑卒中的常用动物模型,可精确控制缺血时长。本研究选择GEO数据库(https://bi.v/geo/)中研究MCAO小鼠表达谱变化的芯片集GSE98319。该数据集包含MCAO小鼠和假手术组小鼠大脑皮层的检测结果。
每组各3个样本。
1.2差异表达分析
用R语言的ggplot包绘制6个样本总体基因表
达箱线图,并对芯片集进行多维度分析(multidi⁃mensional scaling,MDS)。Limma包用于差异表达分析,根据测序平台注释信息及Ensemble数据库对基因类型的注释信息,将探针ID转换为相应的基因名称(gene symbol)并删除LncRNA的数据。选择P<0.05且|log2FC|>0.6作为差异表达基因(dif⁃ferential expressed genes,DEG)筛选标准。差异分析结果以火山图形式呈现。用R语言绘制热图展示数据集的聚类情况。
1.3蛋白质互作网络构建及核心基因筛选
利用STRING(http:///)在线数据库对DEG进行分析,预测可能在脑缺血发病过程中发挥重要作用的基因所编码蛋白质之间的互作关系。选择中度置信度(作用关系综合得分0.4-0.7)作为显著标准。将STRING分析结果导入Cytoscape3.7.1.软件进行可视化,使用Cytohubba和MCODE插件对PPIN进行分析。通过Cytohubba计算出每个节点的度(Degree)[4],Degree得分前10的基因构成的网络可视作核心子网络。通过MCODE (molecular complex detection)从蛋白质
互作网络(protein-protein interaction network,PPIN)中筛出得分最高的3个功能模块亦视作核心子网络[5]。为了进一步缩小核心基因范围,将MCODE评分最高模块的基因及Degree得分前10的基因进行整合,他们与DEG中|log2FC|排名前20基因的交集即为核心基因(hub genes)。
1.4小鼠大脑中动脉梗塞模型建立及核心基因表达水平测定
1.4.1大脑中动脉栓塞模型建立及实验分组3只6~8周SPF级雄性C57B/6J小鼠购自湖南斯莱克景达实验动物有限公司,小鼠体质量为18~25g,许可证号:SCXK(湘)2019-0004。本实验经中山大学实验动物管理与使用委员会同意。3%异氟烷诱导后将小鼠仰卧固定于操作台并戴上麻醉面罩,术中以1.5%异氟烷维持麻醉。颈部备皮消毒后颈正中切口,小心暴露右侧颈动脉鞘并将右侧颈总、颈
43
第42卷中山大学学报(医学科学版)
外及颈内动脉分离出来,在三角分叉处远端结扎颈外动脉,近端穿一根线打活结,用动脉夹夹闭颈总动脉及颈内动脉,在颈外动脉中间剪一小口,将线栓插入颈外动脉后松开颈内动脉夹,将线栓缓慢沿着颈内动脉插入,线栓上的黑标记点到达三角分叉处(插入约1cm左右),有明显阻力时停止。固定线栓,松开颈总动脉夹,缝合伤口。将小鼠放回笼内,侧卧,插栓侧朝上,维持体温。缺血30min
后经原切口拔出线栓,恢复血供,再灌注12h后留取小鼠双侧大脑皮质。小鼠缺血侧皮层为MCAO组,对侧为对照组(CTRL组)。
1.4.2标本收集以及qRT-PCR验证基因表达变化按照奕杉生物组织RNA提取试剂盒说明书提取小鼠双侧皮层RNA,用翊圣生物Hifair®Ⅲ1st Strand cDNA Synthesis SuperMix for qPCR试剂盒将RNA逆转录成cDNA后按照Hieff®qPCR SYBR®Green Master Mix配置出实时荧光定量PCR(quanti⁃tative real-time polymerase chain reactionq,qRT-PCR)体系进行检测。以Actin为内参,用2-ΔΔCT相对定量法分析待测基因的转录水平。所用引物序列见表1。
1.4.3统计方法采用SPSS17.0统计软件进行统计分析。RNA相对表达量为连续性资料,以均数±标准差(
-x±s)表示,组间比较采用t检验(双侧),P<0.05认为差异有统计学意义。
1.5GSEA算法进行功能富集分析
本研究选择GSEA C2数据集中的KEGG基因集(c2.cp.kegg.v7.2.)和C5数据集中的GO基因集(c5.go.mf.、c5.go.bp.、 )为预设基因集,利用R语言对差异分析结果进行GSEA分析。FDR(false discovery rate)<0.05作为富集通路的筛选标准。富集结
果图由R语言的clusterprofiler包[6]和GSEA函数进行绘制。1.6缺血性脑卒中药物预测Connectivity Map(CMap)数据库包含1309种小分子化合物作用于多种细胞系引起的基因表达谱变化数据,可用于比较药物诱导的基因图谱与基因表达之间的相似性,并得到一个从-100到100的连通性评分:该评分大于0,表示化合物引起和上传基因相似的变化;评分小于0,表示该化合物引起和上传基因相反的变化,即该化合物可能对疾病有作用[7]。由于CMap将上传基因数目限制在150个,本文将|log2FC|前150上调DEG 和全部下调DEG(100个)分别上传至Cmap在线数据库(https://clue.io/)进行药物预测。连通性评分<-80的小分子化合物作为本次预测的结果。2结果
2.1缺血性脑卒中差异表达基因的筛选GSE98319数据集的箱线图提示各样本基因表达水平均衡(图1A),具有可比性。MDS(图1B)分析结果提示MCAO组和假手术组能进行有效区分。图1C显示GSE98319芯片集差异表达分析的结果;不同变化方向的基因表达基因用不同颜进行展示。将这些差异基因中lncRNA删去,根据筛选条件,筛出521个差异mRNA,其中421个上调、100个下调。图1D为该数据集的热图,该数据集样本聚类效果较好,可信度较高。
2.2缺血性脑卒中蛋白互作网络的构建以及核心基因的筛选
通过STRING预测521个DEG所编码蛋白质之间的相互作用关系。将预测结果导入Cytoscape软件构建出蛋白质互作网络(图2)。此外,用Cyto⁃scape的插件CytoHubba和MCODE筛选出PPIN中的核心子网络:度(Degree)排名前10的基因构成的子网络(图3A)以及MCODE评分最高的子网络(图
44
第1期
于瑜,等.基于生物信息学途径筛选缺血性脑卒中关键基因及药物预测
3B )。为了进一步缩小核心基因的范围,Degree 前
10的基因及构成MCODE 得分最高子网络的基因与DEG 中上调倍数最高的20个基因求交集(图4),筛选出Drd4和Hcar22个核心基因,表2为他们的差异分析结果。
2.3
实时荧光定量PCR 验证核心基因
MCAO 组与CTRL 组各3个样本,经统计分析
发现脑缺血后Hcar2基因的相对表达量为(6.01±0.54)与对照组(1.00±0.09)相比有所上升,差异有统计学意义(t =15.79,P =0.000094)。Drd4在脑缺
MCAO Sham
20151050
G S M 2591648
G S M 2591649
G S M 2591651
G S M 2591653
G S M 2591655
G S M 2591656
MCAO Sham
-0.5
0.00.5  1.0
0.60.40.20.0
-0.4-0.8
D i s t a n c e o f l o g 2F C
Distance of log 2FC
-l o g 10(P v a l u e
)6
4
2
0-2.5
0.0
2.5
log 2(fold change
)Down
Stable
Up
group 1.510.50-0.5-1-1.5group
Sham
tMCAO
A
B
C D
A:Boxplot of GSE98319gene chip.B :MSD analysis plot of GSE98319gene chip.C :Volcano map of GSE98319gene chip.Red and blue spots rep⁃
resent differentially expressed genes ,red dots represent up-regulated genes and blue ones represent down-regulated genes.D:Hierarchical clustering showed lncRNA and mRNA expression profile between the MCAO groups and Sham group.The color from blue to red indicates that the level of tran⁃
scription is from low to high.(n =3/group)
图1GSE98319芯片数据集箱线图、MDS 图、差异表达基因火山图以及热图
Fig.1
Plots of GSE98319gene chips
45
46
第42卷
中山大学学报(医学科学版)
Up⁃regulated gene
Down⁃regulated gene
Pink circles represent up-regulated DEGs and green ones represent down-regulated DEGs
图2差异表达基因的蛋白质互作网络
Fig.2PPIN of DEGs
A B
C D
A:Sub-network consisted of top10genes in Degree Score calculated by Cytohubba.B-D:the first to third sub-networks rank in MCODE score re⁃spectively.
图3核心子网络
Fig.3Sub-networks of PPIN

本文发布于:2024-09-20 16:36:31,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/90553.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:基因   表达   分析   差异   脑缺血   小鼠   数据
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议