转录调节位点和转录因子数据库介绍_张光亚

10生物学通报2005年第40卷第11期
2003年即Watson和Crick发表DNA双螺旋结构50周年,宣布了人类基因组计划的完成,与此同时,其他许多生物的基因组计划已完成或在进行中,在此过程中产生的大量数据库对科学研究的深远影响是以前任何人未曾预料到的。然而遗憾的是,许多生物学家、化学家和物理学家对这些数据库的使用甚至去何处寻这些数据库都只有一个比较模糊的概念。
基因转录是遗传信息传递过程中第一个具有高度选择性的环节,近20年来对基因转录调节的研究一直是基因分子生物学的研究中心和热点,因此亦产生了大量很有价值的数据库资源,对这些数据库的了解将为进一步研究带来极大便利,本文对其中一些数据库进行简要介绍。
1DBTSS
DBTSS(DataBaseofTranscriptionalStartSites)由东京大学人类基因组中心维护,网址:http://dbtss.hgc.jp。最初该数据库收集用实验方法得到的人类基因的TSS(TranscriptionalStartSites,转录起始位点)数据。对转录起始位点(TSS)的确切了解具有非常重要的意义,可更准确的预测翻译起始位点;可用于搜索决定TSS的核苷酸序列,而且可更精确地分析上游调控区域(启动子)。自2002年发布第一版以来已作了多次更新。目前包含的克隆数为190964个,含盖了11234个基因,
在SNP数据库中显示了人类基因中的SNP位点,而且现在含包含了鼠等其他生物的相关数据。DBTSS最新的版本为3.0。
在该最新的版本中,还新增了人和鼠可能同源的启动子,目前可以显示3324个基因的启动子,通过本地的比对软件LALIGN可以图的形式显示相似的序列元件。另一个新的功能是可进行与已知转录因子结合位点相似的部位的定位,这些存贮在TRANSFAC(http://transfac.gbf.de/TRANSFAC/index.html)数据库中,免费用于研究,但TRANSFAC专业版是商业版本。
DBTSS对匿名登录的用户是免费的,该网站要求用户在使用前注册,用户注册后即可使用。主页分为2个区域,一个介绍网站的部分信息和用户注册,另一区域为用户操作区,该区约分为10个部分,可分别进行物种和数据库的选择、BLAST、SNP以及TF(转录因子)结合部位搜索等部分。后者的使用可以见网页中的Help部分,里面有比较详细的介绍。DBTSS还提供了丰富的与其他相关网站的链接,如上文提到的TRANSFAC数据库、真核生物启动子数据库(Eukaryot-icPromoterDatabase,http://www.epd.isb-sib.ch/)以及人类和其他生物cDNA全长数据库等。
2JASPAR
JASPAR是有注释的、高质量的多细胞真核生物转录因子结合部位的开放数据库。网址http://jaspar.cgb.ki.se。所有序列均来源于通过实验方法证实能结合转录因子,而且通过严格的筛选,通过筛选后的序列再通过模体(motif)识别软件ANN-Spec进行联配。ANN-Spec利用人工神经网络和吉布斯(Gibbs)取样算法寻特征序列模式。联配后的序列再利用生物学知识进行注释。
目前该数据库收录了111个序列模式(profiles),目前仅限于多细胞真核生物。通过主页界面,用户可进行下列操作:1)浏览转录因子(TF)结合的序列模式;2)通过标识符(identifier)和注解(annotation)搜索序列模式;3)将用户提交的序列模式与数据库中的进行比较;4)利用选定的转录因子搜索特定的核苷酸序列,用户可到ConSite服务器(http://www.phylofoot.org/consite)进行更复杂的查询。JASPAR数据库所有内容可到主页下载。
与相似领域数据库相比,JASPAR具有很明显优势:1)它是一个非冗余可靠的转录因子结合部位序列模式;2)数据的获取不受限制;3)功能强大且有相关的软件工具使用。JASPAR与TRANSFAC(一流的TF数据库)有较明显的差异,后者收录的数据更广泛,但包含不少冗余信息且序列模式的质量参差不齐,是商业数据库,只有一部分是可以免费使用。用户在使用过程中会发现二者的差异,这主要是由于二者对数据的收集是相互独立的。另外该数据库还提供了相关的链接:
如MatInspector检测转录因子结合部位,网址http://transfac.gbf.de/programs/matinspector/;TESS转录元件搜索系统,网址http://www.cbil.upenn.edu/tess/。
转录调节位点和转录因子数据库介绍!
张光亚!!方柏山
(华侨大学生物工程与技术系福建泉州362021)
摘要转录水平的调控是基因表达最重要的调控水平之一,对转录调节位点和转录因子的研究具有重要意义。介绍了DBTSS、JASPAR、PRODORIC和TRRD等相关数据库及其特征、内容和使用。
关键词转录调节位点转录因子数据库生物信息学
!基金项目:国务院侨办科研基金资助项目(05QZR06)
!!通讯作者
2005年第40卷第11期生物学通报11
3PRODORIC
PRODORIC(PROkaryotICDatabaseOfGeneRegula-tion)数据库目的是系统地组织有关原核基因表达信息,并将该信息整合到调节网络中。基于此目的,转录因子结合位点、该位点与其他相互作用的蛋白、启动子结构操纵子组成均通过搜寻原始文献组合关联起来。目前的版本主要着眼于一些致病菌如Pseudomonasaeruginosa(铜绿假单胞菌),Listeriamonocytogenes(单核细胞增生李斯特式菌)和Helicobacterpylori(幽门螺旋杆菌),同时也收录了大肠杆菌和枯草杆菌以验证所提供的相关工具。
PRODORIC运用关系数据库模型(relationaldatabasemodel),这是一种修正的TRANSFAC数据库结构,已经越来越适合于细菌的需求[3]。该数据库以收录生物的全基因组序列为基本结构骨架,另外有基因、转录单位、启动子、结合位点、蛋白质组的功能和结构信息以及信号转导和代谢网络等几部分组成。目前该数据库的研究人员主要从结构上描述调节子(regulon)、转录因子、DNA结合位点的互作以及对基因的活化和抑制。PRODORIC的网址为http://prodoric.tu-bs.de.
4TRRD
TRRD(TheTranscriptionRegulatoryRegionsDataba-se,转录调节区域数据库)由西伯利亚分校细胞与遗传学研究所于1993年组建,其目的是通过实验方法收集有关真核基因调节区域的数据。网址http://wwwmgs.bionet.nsc.ru/mgs/dbases/trrd4/。它包括转录调节区域的模块结构以及它们在所有组成调节单元中的分类地位,主要包括:1)顺式元件;2)提供DNA-蛋白质和蛋白质-蛋白质在相邻部位作用的复合元件;3)组成基本转录复合物的启动子;4)调节转录水平的增强子和沉默子;5)DNA5′和3′区的转录调节区域;6)完整的基因转录调节体系。目前最新的版本为4.0,它通过引入新的数据表示格式,提供了更全面关于基因表达调节模体的描述以及这些调节区域的结构特征,以达到计算机可阅读的最大信息。
TRRD包括5个相互联系的部分:TRRDGENES(包含所有TRRD收录的基因以及它们的调节单元的基本信息)、TRRDSITES(包含转录结合因子结合部位的详细信息)、TRRDFACTORS(包含TRRD收录的转录结合因子的详尽描述)、TRRDEXP(包含基因表达谱的描述)和TR-RDBIB(包含TRRD收录所有参考文献的目录)。TRRD收录的基因根据种属特异性、基因编码的蛋白质的类型以及基因的功能等进行分类。今后收录的基因将着重于控制造血作用、内分泌、免疫系统和应急反应的基因。
基因调控网络除了上面介绍的数据库以外,还有许多有关转录调节位点和转录因子的数据库,如:ACTIVIT
Y(功能性DNA/RNA位点活性)http://util.bionet.nsc.ru/databases/activity.html;DBTBS(Bacillussubtilis启动子和转录因子数据库)http://dbtbs.hgc.jp/;DPInteract(大肠杆菌DNA结合蛋白结合位点)http://arep.med.harvard.edu/dpinteract;HvrBase(灵长类线粒体DNA调控区域序列)http://www.hvrbase.org/;PLACE(植物顺式作用DNA元件)http://www.dna.affrc.go.jp/htdocs/PLACE;PlantProm(植物RNA聚合酶II识别的启动子序列)http://mendel.cs.rhul.ac.uk/;TRANSCompel(真核基因复合调控元件)http://com-pel.bionet.nsc.ru/new/compel。
参考文献
1YutakaS.,RiuY.,SumioS.etal,DBTSS,DataBaseofTranscrip-tionalStartSites:progressreport2004,NucleicAcidsResearch,2004,32,78—81.
2AlbinS.,WynandA.,ParE.etal,JASPAR:anopen-ac
cessdatabaseforeukaryotictranscriptionfactorbindingprofiles,Nucleic
AcidsResearch,2004,32:91—94.
3RichardM.,KarstenH.,HeikoB.etal,PRODORIC:prokaryoticdatabaseofgeneregulation,NucleicAcidsResearch,2003,31(1):
266—269.
4KolchanovN.A.,IgnatievaE.V.,AnankoE.A.etal,TranscriptionRegulatoryRegionsDatabase(TRRD):itsstatusin2002,Nucleic
AcidsRes,2002,30(1):312—317.
5MichaelY.G.TheMolecularBiologyDatabaseCollection:2004up-date,NucleicAcidsResearch,2004,32:3—22.
6http://dbtss.hgc.jp
http://transfac.gbf.de/TRANSFAC/index.html
http://www.epd.isb-sib.ch/
http://jaspar.cgb.ki.se
http://www.phylofoot.org/consite
http://transfac.gbf.de/programs/matinspector
http://www.cbil.upenn.edu/tess/
http://prodoric.tu-bs.de
http://wwwmgs.bionet.nsc.ru/mgs/dbases/trrd4/
http://util.bionet.nsc.ru/databases/activity.html
http://dbtbs.hgc.jp/
http://arep.med.harvard.edu/dpinteract
http://www.hvrbase.org/
http://www.dna.affrc.go.jp/htdocs/PLACE
http://mendel.cs.rhul.ac.uk/
http://compel.bionet.nsc.ru/new/compel
(BH)
睡眠大脑的不连通性
当我们入睡时,意识渐渐消失,但大脑仍保持活跃,一项新研究帮助解释了这个现象。研究人员在实验对象进入睡眠之前和之后,测量了他们大脑皮层不同部分之间的连通性程度。他们通过轻度刺激皮层的一小部分,然后记录整个大脑的电活动,来测量。实验对象对研究人员用的磁性刺激没有感觉。当实验对象醒着时,电活动很快地从初始刺激点广泛传播开。但是在实验对象进入非快速动眼睡眠后,
大脑的活动不再传播。未来的研究可能应该将注意力集中到快速动眼睡眠,也就是梦发生的阶段,那时大脑的连通性如何?
摘自《科学时报》2005年10月18日!!!!!!!!!!!!!!!!!!!!!!!

本文发布于:2024-09-21 23:36:12,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/387893.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:转录   数据库   基因   因子   调节   序列   研究
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议