如何寻miRNA靶基因

如何寻miRNA靶基因?——成熟miRNA 的形成
microRNA(miRNA)是一类能够调节基因表达的短单链內源非编码RNA(约22nt),通过与互补的mRNA选择性地结合抑制蛋白的产生,广泛存在于动物、植物、病毒等多种有机体中。
miRNA通常位于基因间或者内含子区域,在细胞核内有RNA 聚合酶Ⅱ转录产生具有帽子结构多聚腺苷酸尾巴的pri-miRNA。在核酸酶Drosha及其辅助因子Pasha的作用下,pri-miRNA被处理成70个核苷酸组成具有茎环结构的pre-miRNA,然后由Exportin 5等转运至细胞质。Dicer将pre-miRNA切割成约22nt的双链miRNA,双链miRNA讲解形成单链的成熟miRNA。成熟miRNA还需要与Argonaute蛋白等组装形成RNA诱导沉默复合体(RISC),RISC 作用于特异mRNA的3’UTR,从而抑制翻译过程或者直接讲解mRNA。整个过程如图所示。
如何寻miRNA靶基因?——生物信息学方法寻miRNA靶基因
尽管对miRNA功能的认识还不是非常清楚,但miRNA在许多生物过程中起关键作用,包括发育、细胞分化、增殖、凋亡、肿瘤转移等。准确快速地预测miRNA靶基因对于研究miRNA功能以及分析
miRNA参与的生物学过程具有十分重要的意义。目前寻miRNA靶基因的方法主要有生物信息学以及生物实验方法。
1、生物信息学方法
生物信息学方法主要是利用某种算法对靶基因样本进行评分及筛选。生物信息学的方法只是通过算法为研究人员提供可能性最大的参考信息,还需要通过实验进行验证。
使用计算机预测植物miRNA靶基因比较简单,因为在植物中miRNA与靶基因几乎还是以完全互补配对的方式结合,预测不需要复杂的算法。而预测动物miRNA靶基因则存在一定的困难,主要是目前已知的miRNA靶基因及其确切靶点不多,在算法编写时没有足够的已知样本可供参考。但是,miRNA与靶基因间的相互作用仍然具有一定的规律性。目前常规的算法主要遵循以下几个常用原则:(a)miRNA与靶基因的互补性;(b)miRNA靶位点在不同物种之间的保守性;(c)miRNA-mRNA双链之间的热稳定性;(d)miRNA靶位点不会有复杂的二级结构;(e)miRNA 5’端于靶基因的结合能力强于3’端。除了这些基本原则以外,不同的预测方法还会根据各自总结的规律对算法进行限制和优化。
(1)miRandamirna靶基因分析
miRanda是最早利用生物信息学对miRNA靶基因进行预测的软件,由Enright等人[1]于2003年开发设计。其对3’UTR的筛选依据主要是从序列匹配、miRNA与mRNA双链的热稳定性以及靶位点的保守性三个方面进行分析。综合这3条原则,miRanda选取每条miRNA相
对的3’UTR中排名前十位的基因,作为miRNA的候选靶基因,对于多个miRNA对应于同一靶位点的情况,miRanda使用贪心算法(Greedy Algorithm)选取其中得分最高且自由能最低的那一对。[2]
(2)TargetScan和TargetScanS
TargetScan是Lewis等人[3]在2003年开发的一款用于预测哺乳动物miRNA靶基因的软件,该软件将RNA间相互作用的热力学模型与序列比对分析相结合,预测不同物种间保守的miRNA结合位点。TargetScan还引入了信号噪声比来评估预测结果的准确度,所谓信号噪声比即用已知(信号组)和随机生成的miRNA(噪声组)分别对mRNA的3’UTR进行预测,所得靶基因数目的比值。随着物种数目的增多,预测得到的靶基因减少,但准确性得到了相应的提高。
后来,Lewis等人[4]又对TargetScan进行了优化,即TargetScanS。TargetScanS在人、小鼠、大鼠的基础上增加了狗(Canis familiaris)和鸡(Gallus gallus)的基因组数据,同时在算法上做了改动。
(3)RNAhybrid
RNAhybrid是Rehmsmeier等人[5]在2004年开发的一种基于分析miRNA和靶基因间形成双链的二级结构,从而预测miRNA靶基因的软件。RNAhybrid在实质上是一种经典RNA二级结构预测软件的扩展,能够快速、准确地计算一条短链RNA和一条长链RNA杂交(如miRNA和mRNA 3’UTR)时的自由能,并基于此来预测果蝇中miRNA
的靶基因。RNAhybrid的算法禁止分子内、miRNA 分子间及靶基因间形成二聚体,根据miRNA和靶基因之间结合自由能探测最佳的靶位点。
(4)DIANA-microT
DIANA-microT是Kiriakidou[6]等人于2004年开发的一款结合了生物信息学和实验学方法的靶基因预测软件。DIANA-microT主要考虑单一结合位点的miRNA靶基因。此外在寻结合位点时,除了必需的5’端种子区外,典型的中央突起以及miRNA在3’端与mRNA的结合也得到了考虑。在算法方面,DIANA-microT主要基于以下两点原则对miRNA靶基因进行判断:首先,通过动态规划算法计算经典的Watson-Crick碱基对及G:U错配的自由能,进而衡量miRNA与靶基因间的结合能力;其次,miRNA相关蛋白影响miRNA与靶基因结合时形成的中央突起的大小与位置,进而影响miRNA与靶基因的结合。(5)PicTar
Krek等人[7]在2005年采用一种更先进的算法来预测脊椎动物、线虫和果蝇中miRNA的靶基因,并通过实验方法进行了验证,这种算法就是PicTar,即组合靶位点的概率识别(probabilistic identification of combinations of target sites)。PicTar的算法包括两个方面:识别单个miRNA的靶位点;为组合的靶位点评分。通过生物信息学和实验方法的分析,PicTar算法估计会有30%左右的假阳性率。(6)RNA22
RNA22是由Miranda等人[8]于2006年开发的一种识别miRNA靶位点以及相应miRNA-mRNA异源双链
的软件。RNA22与其他miRNA 靶基因预测软件不同。首先,RNA22的预测不依赖于物种间的保守性,而是认为即使近亲物种不存在miRNA结合位点,仍有可能是miRNA的靶基因;其次,RNA22与其他软件的预测方向不同,RNA22不是从miRNA入手寻它的靶基因,而是首先从感兴趣的序列入手,寻假定的miRNA结合位点,再进一步确定其被哪条miRNA调控。
上述不同算法各有其特点,主要还是依据miRNA 与其靶位点的互补性、miRNA靶位点的保守性、miRNA-­‐mRNA 双链之间的热稳定性及附近序列的二级结构等原则设计的。其中,miRanda是将miRNA-­‐mRNA之间的序列匹配,保守性及热稳定性作为计算参数,有比较好的检出率,但是假阳性率也较高;TargetScan提出了“种子区”的概念,增加了预测的精确度;RNAhybrid的研究重点在RNA二级结构预测方面,能够更快速准确地计算miRNA-­‐mRNA双链的自由能,降低了假阳性率;DIANA-­‐microT则主要考虑miRNA调控单个靶基因的情况,同时考虑中央突起以及miRNA在3’端与mRNA的结合;RNA22与其他算法不同,不考虑物种间的保守性,检出率较高。

本文发布于:2024-09-22 19:22:54,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/382201.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:基因   预测   算法   结合
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议