Cell重磅综述:关于人类转录因子,你想知道的都在这

Cell重磅综述:关于人类转录因子,你想知道的都在这
前言
基因调控网络NGS系列文章包括NGS基础、转录组分析 (Nature重磅综述|关于RNA-seq你想知道的全在这)、ChIP-seq分析 (ChIP-seq基本分析流程)、单细胞测序分析 (重磅综述:三万字长文读懂单细胞RNA测序分析的最佳实践教程 (原理、代码和评述))、DNA甲基化分析、重测序分析、GEO数据挖掘(典型医学设计实验GEO数据分析 (step-by-step) - Limma差异分析、火山图、功能富集)等内容。
转录因子(Transcription Factors, TFs)指能够以序列特异性方式结合DNA并且调节转录的蛋白质。转录因子通过识别特定的DNA序列来控制染质和转录,以形成指导基因组表达的复杂系统。尽管众多科学家对理解转录因子如何控制基因表达有着浓厚的兴趣,精准定位转录因子在基因组上的特异性结合位点,以及转录因子结合后最终如何参与转录调节仍然具有挑战性。
本综述主要涵盖了1600多种可能的人类转录因子和与其中三分之二转录因子结合的motif,来
鉴定转录因子并对其功能进行注释。本文根据目前对转录因子及其功能的理解,为思考转录因子如何单独又如何作为整体工作提供了思路。
什么是转录因子
转录因子是对基因组的直接阐释,是执行DNA解码序列的第一步。许多转录因子充当着主调节因子和选择基因的角,控制着细胞类型的决定、发育模式和特定途径控制(如免疫反应)的过程。在实验室中,转录因子可以促进细胞分化、去分化和转分化。转录因子和转录因子结合位点突变是人类致病的主要因素。在后生动物中,他们蛋白质序列调控区的生理作用通常非常保守,这表明基因组调控'网络'可能同样是保守的。但是,个别监管序列的转换率很高,当时间尺度更长时,转录因子可能会发生多拷贝和突变。相同的转录因子可以调节不同细胞类型中的不同基因(例如,乳腺和子宫内膜细胞系中的ESR1),这表明即使在同一生物体内转录因子的调节也是动态的。确定转录因子如何以不同方式组装以识别绑定位点和调控'网络'转录是一项庞大而令人望而生畏的工作,但是,对于理解它们的生理作用、解码基因组的特定功能,以及在复杂生物中绘制高度特异性表达程序的编排是至关重要的。
相对于其他序列,转录因子对特异性结合序列具有1,000倍甚至更高的偏好,因为转录因子可以通过阻断其他蛋白质的DNA结合位点进而发挥作用(例如,经典的lambda,lac和trp 阻遏物),单独结合特定DNA序列的能力通常被视为调节转录能力的指标。如果没有转录因子结合的DNA序列的详细信息,就不能在功能上理解这些蛋白质。转录因子与特异性DNA结合通常概括为“基序”(motif) ,是指给定TF优先的相关短序列组的模型,其可用于扫描较长序列(例如,启动子)以鉴定潜在的结合位点。确定DNA结合的motif通常是详细阐释转录因子功能的第一步,鉴定潜在的结合位点为进一步分析提供了途径。在过去的十年中,我们开发motif和基因组结合位点的能力得到了显着提高,从而产生了关于TF-DNA相互作用的前所未有的大量数据。为了开发目前的TF目录,本文主要参考了TRANSFAC,JASPAR,HT-SELEX,UniPROBE和CisBP,以及先前的人类转录因子目录。
R语言 - 绘制seq logo图
Seq logo 在线绘制工具——Weblogo
如何识别转录因子
最早在20世纪80年代,就描述了真核生物中的主要TF家族,如C2H2-锌指(ZF),同源域,碱性螺旋 - 环 - 螺旋(bHLH),碱性亮氨酸拉链(bZIP)和核激素受体(NHR)。通常通过诸如DNA酶足迹法或迁移率变换的方法鉴定结合位点,再使用N-末端肽测序,噬菌体文库或单杂交筛选鉴定特定结合蛋白。继续通过实验方法鉴定(例如,单杂交测定,DNA亲和纯化-质谱,和蛋白质微阵列可以筛选新的DNA结合蛋白),但是今天,大多数已知和推定的TF已经通过先前表征的DNA结合结构域(DBD)的序列同源性来鉴定,这也用于对TF进行分类。目前在蛋白质数据库(PDB)中可获得大约100种已知的真核生物DBD类型。迄今为止,除了少数充分表征的哺乳动物转录因子之外的所有转录因子都含有已知的DBD。在仅基于与DBD的同源性匹配来推断功能时必须小心,因为并非所有结构域都一定会结合特定DNA序列。
如何确定TF-DNA结合的motif
首先根据结合位点中每个碱基的转录因子的相对偏好产生一张基础表或“位置权重矩阵”(PWM)。在每个碱基位置,四个碱基中的每一个都具有得分,并且将序列的每个碱基的这些得分相乘来预测得到转录因子对该序列的相对亲和力。在许多情况下,这反映了
对一个或少数相关序列的强烈偏好。此外,PWM还存在一些缺点:基线位置之间可能存在依赖关系由于DNA形状或可变形性; 转录因子可以具有多种结合模式(例如,蛋白质的不同物理构型导致分离的,不同的基序)等。为了解释这些复杂性,科学家们开发了更复杂的模型,例如结合了对二核苷酸和高级k-mers的偏好,使得转录因子及其家族的准确性有所提高。然而,在许多情况下,改进的效果很小甚至检测不到。PWM仍然是分析转录因子结合最常用的模型,并术语“motif”来表示PWM。
一文教会你查基因的启动子、UTR、TSS等区域以及预测转录因子结合位点
接下来通常通过实验确定的结合位点和与motif匹配的序列之间仅存在部分重叠,甚至实验确定的结合位点是相对较差的预测因子。同时,motif匹配通常是ChIP-seq(染质免疫沉淀测序)数据集中最富集的序列之一,表明内在DNA结合的特异性对于体内转录因子的结合是重要的。出现这样的现象不是空穴来风,大多数转录因子结合位点很小(通常是6-12个碱基),并且是灵活的,因此典型的人类基因(> 20 kb)将包含大多数转录因子的多个潜在结合位点。因此我们需要通过其它途径来解决问题,例如转录因子之间的协同性和协同作用,为这种特异性缺陷提供了一个现成的解决方案。大多数人类的转录因子必须共同
努力才能完成任何事情,但是他们之间的相互作用和关系的细节大多数是未知的。结合DNA后转录因子的生物化学作用也在很大程度上未被反映出来。因此,解码基因调控如何与TF结合基序和基因序列相关仍然是一个主要的现实层面的挑战。
如何获取目标基因的转录因子(上)——Biomart下载基因和motif位置信息
如何获取目标基因的转录因子(下)——Linux命令获取目标基因TF
转录因子的协同性和与核小体的相互作用
理论论证和实践观察表明,后生动物的转录因子一般必须共同作用才能与DNA结合,在效应功能中达到所需的特异性。转录因子有多种合作方式,例如帮助相互结合DNA(协同结合)或通过不同机制影响染质状态或转录(协同调节)。TF还可以作为同二聚体(例如,bZIP和bHLH),三聚体(例如,热休克因子)或更高级结构协同结合。
协同结合可以通过几种方式发生。当它由蛋白质-蛋白质相互作用介导时最容易理解,当两个(或更多个)相互作用蛋白质以相容的间隔和方向结合DNA时,便赋予其额外的稳定性。高通量体外研究表明,协同结合常常影响复合物中转录因子的序列偏好,并且还可能
对两个结合位点之间的间隔序列产生限制。单分子成像的结果研究证实,当多个转录因子结合在一起时会占据更长时间。
最近的研究表明DNA介导的协同结合也在转录因子功能中起重要作用。分子建模和结构分析表明,在某些情况下,协同性是由于DNA促进了蛋白质之间的接触。在其他情况下,蛋白质结合在DNA的对立面或彼此相对较远的一边,表明DNA直接介导了协同性。也就是说,一个转录因子的结合以促进另一个转录因子结合的方式影响DNA的形状。
为了与核小体DNA结合,TF必须与核小体竞争或以某种方式与核小体或核小体DNA相互作用以进入其位点。TF也可内在地与核小体竞争结合TF,此外,一些TF可以启动核小体的置换或至少改变它们的构象。这些TF的活性也可能取决于它们结合核小体DNA的能力,这可能受核小体上结合位点的旋转定位的影响(例如,Yamanaka因子 POU5F1,SOX2,KLF4和MYC)。另一个有趣的现象是,不同的染质重塑器具有特定DNA序列和/或核小体构象的偏好,表明核小体和核小体的定位机制赋予了TF功能上额外的DNA序列特异性。
转录因子效应器的功能
转录因子在与DNA结合时影响转录的方式变化很大。一些转录因子(例如,TBP)可以直接RNA招募聚合酶,还有一些可以招募促进特定转录阶段的辅助因子。大多数真核生物的转录因子被认为通过招募辅助因子起作用。这种“共激活因子”和“辅阻遏物”最初被鉴定为转录因子效应子活性的介质,通常是大的多亚基蛋白质复合物,或通过几种机制调节转录的多结构域蛋白质。它们通常涉及染质结合,核小体重塑和组蛋白或其他蛋白质结构域的共价修饰。IFNβ增强体是共激活因子招募的一个经典例子,其中多个转录因子的结合导致GCN5 / KAT2A和 CBP / p300 组蛋白乙酰转移酶的募集。由此产生的局部染质环境变化会引起核小体重塑,如 SWI / SNF复合物为RNA聚合酶创造空间以结合并启动转录。一些共激活因子和辅阻遏物似乎更广泛。p300经常被用作增强子的标记物,与数十种TF相关联。连接TF和RNA聚合酶II的Mediator复合物类似地与数千个基因座相关联。

本文发布于:2024-09-23 04:17:47,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/387340.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:转录   因子   结合   序列   位点   蛋白质
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议