MicroRNA基因上下游分析报告

MicroRNA基因上下游分析报告
结直肠癌相关的miR-10000的上游和下游调控关系分析样例
背景
基因的上下游分析是做⽣物医学研究必要的分析之⼀,但需要整合各种调控数据库以及多样本基因表达数据,某些研究⼈员可能⽆从下⼿。只需要提供感兴趣的基因(或者miRNA,TF)名称,云⽣信整合全世界公共数据库所有样本数据,从众多基因上下游的分析结果中,挑选出与疾病最相关的结果。结果作为实验的理论⽀持,⼤⼤降低实验的假阳性。
基因的上下游分析分析内容:转录因⼦调控靶基因分析(TF-target);microRNA调控靶基因分析(miRNA-Target);蛋⽩质与蛋⽩质相互作⽤分析(PPI);其他如TF-miRNA、TF-lncRNA、lncRNA-mRNA、miRNA-lncRNA等。
整合的全球公共数据库所有样本数据:各个物种的转录调控数据库(TRANSFAC、JASPAR、TRED、PAZAR、AGRIS、RegulateDB、CHIPBASE等);各种miRNA调控靶基因的算法⼯具(miRBase、miRWalk、TargetScan、miRanda、PicTar、PITA等);蛋⽩互作数据库(如HPRD、STRING、DIP、BioGRID、MINT等);TCGA数据库的RNA-seq、small-RNA-seq等;GEO数据库的基因芯⽚、miRNAx芯⽚等。
分析⽬的:
通过对结直肠癌公共芯⽚数据的分析,获得与结直肠癌相关的mir-10000(此处数字为代指,下同)调控的上游、下游基因。
分析过程:
1、公共芯⽚数据的选择下载。
本分析使⽤的数据下载⾃GEO(GSE410000)[1],样本来⾃1992年⾄2004年期间在MSK肿瘤中⼼接受诊治的结直肠癌患者,包括10000例结直肠癌样本,与510000例正常结直肠组织对照。芯⽚平台使⽤的是Affymetrix HG-U133A ,能够检测超过10000个⼈基因的转录表达⽔平。
2、差异表达基因分析
我们使⽤R软件包Limma[2]中的经验贝叶斯模型识别110000例结直肠癌与50000例正常结直肠组织之间的差异表达基因,以logFC绝对值⼤于或者等于0.585(相当于1.5倍的平均表达⽔平改变)和adj.P.Val ⼩于0.05为基因显著差异表达的阈值。adj.P.Val是Benjamini & Hochberg⽅法[3]进⾏多重检验校正的结果。我们⼀共发现了522个显著上调基因和653个显著下调基因。
3、miRNA靶基因关系分析
使⽤miRecord数据库[4]的实验验证数据,以及miRecord数据库的预测数据。其中,miRecord预测⼯具我们使⽤了
miranda[5],mirtarget2[6],pita[7],rnahybrid[8],targetscan[9]这5中预测⽅法进⾏分析,然后选择预测结果出现4次及以上的关系对作为miRNA调控靶基因关系对。最后,我们将这些预测得到的靶基因与结直肠癌差异表达基因进⾏交集分析,得到了miRNA调控的差异表达基因信息。
miRecord Validated Targets数据库中,经过实验验证的miR-10000调控靶基因只有⼀个结果,即MTA1基因。miRecord Predicted Targets数据库中,选择⼤于等于4次的关系对,最终得到了2214个靶基因。
将实验验证结果+预测结果共计2215个靶基因与522个显著上调基因和653个显著下调基因取交集后,分别得到了49个上调靶基因和58个下调靶基因。如图1所⽰。
图1 miR-10000的靶基因与差异表达基因的venn图
4、TF调控miRNA分析
我们使⽤CHIPbase[10]数据预测分析调控miR-10000的转录因⼦(TF)信息,然后从中筛选出属于差异表达基因的TF。
利⽤CHIPbase数据库我们得到,调控miR-10000的转录因⼦共有10000个,其中属于结直肠癌差异表达基因的共有2个,即MYC,CEBPB。
5、构建整合⽹络图。
结合miR-10000的上游和下游分析结果,使⽤cytoscape[11]软件做图,结果如图2所⽰。
图2 整合⽹络图。菱形代表转录因⼦(TF);六边形代表miRNA;椭圆代表靶基因。红⾊代
表差异上调基因,绿⾊代表差异下调基因。
结论
通过以上的分析,我们能够得到与疾病(结直肠癌)相关的差异表达基因列表,miR-10000调控的靶基因以及被调控的转录因⼦,并从中获得与结直肠癌相关的miR-10000的上游和下游关系。我们可以从中获得重要的转录因⼦,并挑选合适的靶基因。
参考⽂献
1. Sheffer, M., et al., Association of survival and disease progression with chromosomal
instability: a genomic exploration of colorectal cancer. Proceedings of the National Academy of Sciences of the United States of America, 2009. 106(17): p. 7131-6.
2. Smyth, G.K., Limma: linear models for microarray data, in Bioinformatics and
Computational Biology Solutions Using {R} and Bioconductor, R.G.a.V.C.a.S.D.a.R.I.a.W. Huber, Editor. 2005, Springer: New York. p. 397--420.
3. Benjamini, Y.H., Yosef Controlling the false discovery rate: a practical and powerful
approach to multiple testing. Journal of the Royal Statistical Society, Series B, 1995.
57(1): p. 289-300.
4. Xiao, F., et al., miRecords: an integrated resource for microRNA-target interactions.
Nucleic acids research, 2009. 37(Database issue): p. D105-10.
5. John, B., et al., Human MicroRNA targets. PLoS biology, 2004. 2(11): p. e363.
6. Wang, X., miRDB: a microRNA target prediction and functional annotation database with
a wiki interface. RNA, 2008. 14(6): p. 1012-7.
7. Kertesz, M., et al., The role of site accessibility in microRNA target recognition. Nature genetics, 2007. 39(10): p. 1278-84.
8. Kruger, J. and M. Rehmsmeier, RNAhybrid: microRNA target prediction easy, fast and flexible. Nucleic Acids Res, 2006. 34(Web Server issue): p. W451-4.
9. Agarwal, V., et al., Predicting effective microRNA target sites in mammalian mRNAs. Elife, 2015. 4.
mirna靶基因分析
10. Yang, J.H., et al., ChIPBase: a database for decoding the transcriptional regulation of long non-coding RNA and microRNA genes from ChIP-Seq data. Nucleic Acids Res, 2013.
41(Database issue): p. D177-87.
11. Smoot, M.E., et al., Cytoscape 2.8: new features for data integration and network visualization. Bioinformatics, 2011. 27(3): p. 431-432.

本文发布于:2024-09-22 21:12:36,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/382202.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:基因   分析   表达   差异   调控   结果
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议