肿瘤中lncRNA机制研究的常见思路

肿瘤中lncRNA机制研究的常见思路
lncRNA的生物学功能【1】
目前人们对lncRNA认识还处在初级阶段,lncRNA起初被认为是基因组转录的“噪音”,是RNA聚合酶II转录的副产物,不具有生物学功能。然而大量研究表明,lncRNA在细胞核内、核外,通过染质修饰,转录调控,转录后调控等多种方式调节基因表达,在肿瘤发生发展中具有重要作用。
lncRNA在肿瘤中的作用机制【2】
肿瘤中部分已知lncRNA【3】
lncRNA功能研究的基本思路
一般来说,lncRNA功能研究的主线包含3个主要步骤:
(1)高通量筛选。全转录组测序和lncRNA芯片是目前最常用的技术手段,通过这种高通量的筛选方法,可以快速获得不同实验组间差异表达的lncRNA和mRNA。
(2)候选lncRNA的确定。通过生物信息学分析,从大量lncRNA 中筛选有潜在功能意义的lncRNA。
yig滤波器(3)目标lncRNA的功能分析与验证。根据上述生物信息分析推断出lncRNA可能的生物学功能,并设计相应的实验来验证假设是否成立。
lncRNA研究的基本流程
生物信息学——确定候选lncRNA
1
lncRNA和mRNA的差异表达分析
通常所说的lncRNA测序其实就是全转录组测序,与普通mRNA测序不同的是,lncRNA测序是通过rRNA去除从而对含有polyA结构和不含polyA的RNA一同富集并建库测序。理论上这种策略能够鉴定到更多的lncRNA,并且能够与mRNA同时进行分析,更有利于推测lncRNA可能的调控途径。同样的,lncRNA芯片也同时包含mRNA和lncRNA的探针,以上这些优势使得lncRNA测序和芯片技术成为了目前最主流的高通量筛选手段。
lncRNA历年文献发表情况【3】
2
确定候选的lncRNA
因为目前已知的lncRNA数量非常庞大,加上转录组测序鉴定出来的新lncRNA,一次实验往往能够获得非常大量的差异表达lncRNA,因此除了通过统计学的筛选(比如fold-change和p-value),必须利用各种生物信息学方法进一步推测这些差异表达lncRNA的功能,确定与肿瘤发生发展关系密切的lncRNA做为候选。主要的方法有以下一些:
(1)根据lncRNA在基因组上的位置进行筛选
根据lncRNA在基因组上与附近mRNA的位置关系, lncRNA可以分为以下五种类型:
lncRNA的类别示意图【4】
(2)根据lncRNA的靶基因进行筛选
虽然目前数据库中收录了数量庞大的lncRNA序列,但绝大部分仅仅是序列而已,但是基因组中的3万多个基因的功能却是相对比较清楚的,因此我们可以首先通过预测lncRNA与mRNA之间可能的靶向调控关系,进而根据mRNA的功能反过来推测lncRNA的功能。
cis靶基因:lncRNA的顺式作用靶基因主要是基于其对于基因组位置上下游基因的影响来进行预测。利用已有的基因组注释文件,对lncRNA上下游10kb区域内进行寻,所有关联到的基因均可作为lncRNA的cis靶基因。
trans靶基因:lncRNA的反式作用靶基因主要是基于序列互补进行的。其认为lncRNA序列和对应的靶基因序列互补,可以将其他因子携带到靶基因上进行调控。使用软件为blast和RNAplex,blast进行序列互补计算,RNAplex进行热力学上的互补计算。
靶基因富集分析:获得靶基因之后,我们也可以进一步通过靶基因的功能和参与的pathway进行富集分析,通过显著性富集的GO或pathway与疾病之间的关系,再反过来寻对应的lncRNA。
lncRNA靶基因的pathway富集
(3)根据lncRNA与mRNA在表达上的协同关系进行推断
共表达分析(co-expression)
交通管理信息系统基因表达受到复杂的调控网络的调控,这包括其他基因和非编码RNA,通过共表达计算构建共表达基因调控网络,可通过网络筛选具有hub地位的lncRNA(即该lncRNA与其它基因具有很高的连通度)。
lncRNA-mRNA共表达网络示例图
也可以分别构建疾病组和对照组的共表达网络,然后比较两个网络之间“地位”变化最明显的lncRNA。另一方面,在已知某个mRNA功能的前提下,也可以直接通过这种方法,直接寻到与该mRNA关系最密切的lncRNA。
疾病组网络                         对照组网络【5】
加权共表达分析(WGCNA)
加权基因共表达网络分析(weighted gene co-expression network analysis)算法作为一种高
效、准确的数据挖掘方法,日前应用非常广泛【6】。
WGCNA共表达网络分析示例图
WGCNA算法致力于寻协同表达的基因模块(module),并探索基因网络与研究者关注的表型之间的关联关系。module被定义为一组具有类似表达谱的基因,如果某些基因在一个生理过程或不同组织中总是具有相类似的表达变化,那么我们有理由认为这些基因在功能上是相关的,可以把他们定义为一个模块。也可以这么理解,每个模块就是一个“超级基因”,它的表达量是所有成员共同作用的结果。以上所说的“基因”时候一个广义的概念,当我们把mRNA和lncRNA放在一起进行分析时,module中就同时包含了两者的信息。由于目前已知功能的lncRNA微乎其微,这种分析策略非常有助于寻跟我们所熟知的mRNA关系密切的那些lncRNA,从而有效缩小候选lncRNA的范围。
肝癌中lncRNA的共表达网络【7】
钩子程序
4)基于lncRNA与protein的关系进行筛选
通过以上生物信息学手段,能够推断出lncRNA与mRNA可能存在的调控关系,但这仅仅是
计算的层面,在生物学层面上这种调控往往是通过lncRNA-蛋白复合物的形式发挥作用的。即lncRNA首先与某些蛋白(包括转录因子、表观修饰因子等)形成RNA-protein复合体,然后再与下游的DNA结合,调控DNA的转录。
lncRNA介导的这种转录调控作用多为trans调控,即lncRNA对其他染体上编码基因的调控。
linc1992-hnRNPL复合体对TNFα的调控【8】
但也有研究发现,lncRNA-protein 也能够以cis的方式对同一染体上临近mRNA的转录进行调控。分度机构>灯头盒
lncTCF7-SWI/SNF复合体激活附近的TCF7表达【9】
通过类似这种模式,lncRNA也可以作为分子阻断剂。这一类lncRNA被转录后,会直接和蛋白结合,由于lncRNA的结合,这类蛋白的功能被阻断,从而影响了下游的基因转录。或者,lncRNA跟蛋白的结合,妨碍了该蛋白与另一个蛋白形成复合物,即可抑制了蛋白之间形成有功能的复合体。
灭茬机(5)根据lncRNA与miRNA的靶向关系筛选
细胞内存在竞争性内源RNA(Competitive endogenous RNA,ceRNA),这些ceRNA分子(mRNA,lncRNA、假基因等)能够通过miRNA应答元件(MicroRNA Response Element,MRE)竞争结合相同的miRNA以达到调节彼此表达水平。细胞内除mRNA之外,还存在另外一些RNA分子,比如长链非编码RNA(lncRNA)也存在miRNA应答元件(MRE),当lncRNA与mRNA存在相同的MRE时,他们之间构成了竞争相同种类miRNA的关系,换句话说,细胞内lncRNA表达水平的高低,直接影响了可被相应mRNA结合的miRNA数量的多少,也就是说,lncRNA通过MRE这个桥梁,间接地调控了mRNA的表达水平,从而调控细胞功能。
根据以上原理,我们可以通过软件预测lncRNA与miRNA可能存在的靶向关系,再根据已知的miRNA与mRNA之间的调控关系,最终确定3者之前的网络。ceRNA分析是基于lncRNA和mRNA的表达值,通过回归模型分析筛选ceRNA对,与microRNA种子序列和lncRNA和mRNA匹配,这两方面结合进行预测,建立microRNA的海绵吸附作用的调控网络,到核心的ceRNA。有些算法同时考虑miRNA的表达【10】,但因为ceRNA对miRNA只是吸附,并不一定影响miRNA本身的表达,所以也可以不去考虑。
ceRNA调控网络示例图

本文发布于:2024-09-21 20:47:01,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/115363.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:基因   调控   进行   表达   功能   转录
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议