杨树微卫星序列对基因表达频率的影响及表达序列中微卫星特征的分析

第35卷 第1期2011年1月
南京林业大学学报(自然科学版)
《穆斯林的无知》
Journa l o fN anji n g Forestry Un i v ersity (Natural Sc ience Ed ition)
V o.l 35,N o .1Jan .,2011
htt p ://www.n l dxb [do :i 10.3969/.j issn .1000-2006.2011.01.003]
收稿日期:2010-08-22    修回日期:2010-12-04
基金项目:江苏省高校自然科学基金重点项目(10KJ A180018);国家自然科学基金项目(31070543,30971609) 作者简介:刘菁菁(1985)),博士生。*尹佟明(通信作者),教授,长江学者。E -m ai :l t my i n @n jf u .co m 。
引文格式:刘菁菁,戴晓港,王洁,等.杨树微卫星序列基因表达频率的影响及表达序列中微卫星特征的分析[J].南京林业大学
学报:自然科学版,2011,35(1):11-14.
杨树微卫星序列对基因表达频率的影响及
表达序列中微卫星特征的分析
刘菁菁,戴晓港,王 洁,李淑娴,尹佟明
*
(南京林业大学,林木遗传与生物技术省部共建教育部重点实验室,江苏省杨树种质创新
与品种改良重点实验室,江苏 南京 210037)
摘要:微卫星是真核生物基因组中的一类高度重复的序列,一般分布在内含子区和基因间隔区中,但基因编码区也含有一定数量的微卫星。为探讨含有微卫星的基因表达频率是否偏低,对NCB I 公共数据库中的421725条杨树EST 序列进行了分析,结果发现:其中53524条EST 序列中含有微卫星,含微卫星的EST 序列比例是12169%;而杨树基因组注释的45555个基因中,有6953个基因含有微卫星,含微卫星的基因占基因总数的比例为15126%。对两样本频率进行差异显著性检验,结果显示微卫星在表达序列中的发生频率显著低于在注释基因中的发生频率(p <0101),这说明含有微卫星的基因总体上表达水平偏低。而对表达序列中微卫星的特征进行分析的结果显示,三碱基重复微卫星含量最丰富。在此,笔者提出了基因组中含有微卫星的基因可能总体表达水平偏低的假说,并利用杨树公共数
据库中海量DNA 序列对这一假说进行了验证。关键词:杨树;基因区微卫星;基因表达;基因存活中图分类号:S722    文献标志码:A
文章编号:1000-2006(2011)01-0011-04
E ffect of m icrosatellites on gene expression level and
characteristics of expressed SS R s i n poplars
LI U Jing ji n g ,DA I X iaogang ,WANG Ji e ,L I Shux ian ,Y I N Tong m i n g
*
(K ey L aboratory of Fo rest G ene tics and Biotechno l ogy M i n i stry of Educa ti on ,Jiangsu K ey L aboratory for Poplar G er m plas m Enhance m en t and V a riety I m provement ,N an ji ng F orestry U n i versity ,N anji ng 210037,Chi na)Abstrac t :M i crosa tellites are high l y repetitive sequences i n eukaryo ti c geno m es ,wh i ch are co mmon l y found in the i n -tron ic and i ntergenic reg i ons .T he gen ic reg i ons also contain a nu mber of m icro sate llites .M icrosate llites are t he m ost va riab l e sequences i n the genom es of diff e rent organ i s m s .M utation i n m i crosa tellite sequences w ill lead genes t o produce shorte r o r comp letely different pro teins .T hus ,genes con tai ns m i cros
a tellites w ou l d be strong l y a ffected by se lecti on .Low expression l eve l is supposed t o be one of t he m echan is m s t ha t re l ax the selecti on aga i nst the correspond i ng genes and he l p their surv iva.l In th i s paper ,w e ana l yzed 421725poplar EST s in t he pub lic l y ava ilab l e NCBI database and detec -ted 53524EST s conta i ned m i c rosa tellites ,accounti ng for 12169%o f the i nvesti g ated ES T s .W hereas i n t he 45555gene m ode ls anno tated fro m the poplar genom e sequences ,6953genes conta i ned m icrosate llites ,accounti ng for 15126%o f the tota l genes .Based on the frequency test be t w een the ES T database and gene da tabase ,m icro sate llites w ere found to occur w ith si gn ifi can tly l ow er frequency i n ES T s t han in anno tated g enes (p <0101).Therefore ,the re -su lts proved that the m icrosa tellites frequency i n expressed genesw as lo w er than that of t he expected level f o r a ll genes .T he character i stics of m i crosa tellite i n ES T s w ere a lso explored i n t h is st udy .T he resu lt show ed tha t tr i plets w ere t he m ost frequent m i c rosa tellites i n ES T s .In th i s paper ,t he hypothes i s tha t genes con tai n i ng m icrosate llitesm i ght have lo w expressi on l eve l is proposed for the first ti m e .M eanwhil e ,a large nu m be r of EST s are analyzed to ve rify this hypothes i s .
南京林业大学学报(自然科学版)第35卷
T h i s st udy prov ides i m portan t ev i dences f o r us to understand the surv i va lm echanis m of m
混合糖电解质注射液icrosate llites i n genes.
K ey word s:pop l a r;gen i c m i crosa tellites;gene expressi on;gene surv i va l
微卫星又称SSR(si m ple sequence repea,t简单重复序列),是真核生物基因组中的高度重复序列,是由少数几个核苷酸组成串联重复序列[1]。微卫星长度变异产生于DNA复制或修复过程中DNA链的滑动和错配,或产生于有丝分裂或减数分裂过程中妹染单体的不均等交换,因此这种重复序列多存在于承受选择压力较小的基因组区。目前普遍认为微卫星可能充当基因重组的热点,是基因重排和变异的来源。微卫星不稳定性是指简单重复序列的增加或丢失,也称为普遍性体细胞突变(ubiquitous so m atic mutation,US M),微卫星不稳定性首先在结直肠癌中发现[2-4]。在人类基因组中,微卫星是癌变过程和表型变化的标志[5]。由于微卫星是真核生物基因组中变异最为迅速的序列,具有高度的遗传多态性,并且遵照孟德尔规律遗传,可以作为很好的遗传标记。微卫星已广泛应用于遗传图及物理图构建、基因定位、遗传多样性和物种进化分析、亲缘关系鉴定、比较基因组学及分子标记辅助选择育种等方面的遗传研究中[6]。
在真核生物基因组中,微卫星通常出现于内含子和基因间隔区,但也出现在DNA编码区。由于微卫星序列容易发生变异,编码区中微卫星突变会导致基因表达产物的改变,在选择作用下,编码区微卫星发生频率比其他基因组区域低。以杨树为例,杨树基因组中仅有4%的微卫星序列分布在基因编码区,
而且编码区微卫星的发生频率仅为非编码区的1/3[7],因此含有微卫星的基因在进化过程中可能受到选择作用而逐渐丢失。通过对杨树基因组的同源复制染体片段上含微卫星基因的序列比对发现,复制染体片段上约有95%编码区微卫星发生了缺失,其中4513%是由于复制基因中微卫星序列缺失,5417%是由于含微卫星的复制基因发生了缺失[8]。基因序列中的微卫星一方面增加了基因的不稳定性,但同时为基因的变异提供了动力。杨树全基因组序列的完成[9]和公共数据库中贮存的大量的杨树表达序列标签(expressed sequence tag,EST)为分析编码区微卫星的表达水平提供了可能。该研究旨在利用杨树公共数据库中的序列信息,比较EST序列(表达的基因)和注释基因(包括表达和不表达的基因)中微卫星的发生频率,以探讨含有微卫星的基因是否总体上表达水平偏低,同时对表达序列含有的微卫星特征展开分析。
1材料与方法
从NCBI(美国国立生物技术信息中心)的EST 数据库(b.i nl m.n v/est)下载杨树全部的EST序列(样本1),在杨柳科杨树属目录下共有18个种,包括毛果杨(P o pulus trichocarpa)、黑杨(P.ni g ra)、美洲黑杨(P.deltoides)、欧洲山杨(P.tre mula)、胡杨(P.euphratica)等。截止2010年4月23日,杨树EST序列总数为421725条。从美国能源部联合基因研究所网站(Popu l u s trichocar pa v1.1版本,geno m e.jgi-ps.f org/Poptr1_1/ Poptr1_1.do wn load.ht m l)下载杨树基因组注释的基因(样本2)。利用SPUTN I K程序(abajian. net/spu t n i k/)对下载的EST序列进行SSR搜索。SPUTN I
K是由华盛顿大学的Abajian博士用递归算法筛选出重复单元长度在2~5bp之间的SSR[10]。
微卫星发生频率差异显著性检验根据两样本频率的假设检验展开分析,两样本频率差数标准误在
H0:P1=P2的条件下,S
p1-
p2=
p q
1
n1
+
1
n2
其中:盐城市第一小学教育集团
郑道传
p=
x1+x2
n1+n2
, q+
p=1,(该文中x1=53524,n1= 421725,x2=6953,n2=45555)。
由于np和nq均大于30,所以不需要进行连续性矫正,u=
p1-
p2
S
p1-
p2
。若|u|>u0101=2158,则在p< 0101水平上否定H0,认为两样本中微卫星发生频率存在极显著差异,反之则认为两样本中微卫星发生频率差异没有达到极显著水平[11]。
2结果与分析
211微卫星发生频率比较
对杨树421725条EST序列进行搜索,共在53524条EST序列中检出微卫星,含微卫星的EST 序列占分析EST序列总数的12169%;而杨树基因组注释的所有45555个基因中,有6953个基因含有微卫星,含微卫星的基因占基因总数的15126%。2个样本中频率差异显著性检验|u|= 15153,|u|>u0101=2158,所以微卫星发生频率在两样本中达到极显著差异水平。如果含微卫星的基因与其他基因相比在表达水平上没有差异,则
12
第1期刘菁菁,等:杨树微卫星序列对基因表达频率的影响及表达序列中微卫星特征的分析EST 序列(表达的基因)和注释基因中(包括表达和不表达的基因)含微卫星的比例不会有明显差异,所以该研究结果显示,含微卫星的基因表达水平低于平均期望水平。
212 杨树表达序列中所含微卫星特征分析
该研究查的EST 序列中所含微卫星为二碱基至五碱基重复,这几种微卫星所占比例分别为25187%、46113%、15157%、12143%,研究结果显示杨树EST 序列所含微卫星中,三碱基重复微卫星相对其他类型的微卫星显著富集,占所发现微卫星总数的一半左右(图1)。
图1 EST 序列中所含不同长度重复单元
微卫星所占的比例
Fig .1 The proportion of m i crosate llites w ith d ifferen t
repeat m otif len gths i n E ST -SSR s
在对样本分析发现,杨树EST 序列中查到的全部微卫星的平均长度为15199bp ,最长的为156bp ,最短11bp 。这些微卫星中以第2类微卫星[12]
为主,长度大于20bp 的微卫星仅占总数的16163%(图2)
图2 杨树EST 序列中微卫星长度分布及不同
长度微卫星的频率
F i g .2 Th e lengths d istr i bu ti on and the frequ ency
of the correspond ing m icrosatellites i n EST sequen ces
注:图中最后一点包括所有\20bp 的微卫星。
3 讨 论
在植物中微卫星主要被作为分子标记构建遗
传图谱、研究体结构和多样性等,其功能方面的研究还处在起始阶段。但是在动物和人类医学中微卫星的研究已经相当深入。许多学者认为微卫星可能参与基因表达调控及基因重排与变异等重要生命活动,科学家们发现微卫星的不稳定性与肿瘤发生及神经系统疾病发生密切相关
[2-5,13]
,所以
微卫星的长度变化对生物的生命活动有显著影响,而且基因中微卫星的存在可能会引起有害突变。
Stree l m an 等[14]
在罗非鱼中进行的研究也表明微卫星的存在对动物生理活动有明显影响。他们的研究结果还显示,微卫星的长度与基因表达量的增加或减少有关,在没有环境压力的情况下微卫星长度越长,基因表达量就减少,在有环境压力的情况下结果则正好相反。这一研究显示基因区微卫星的存在与基因的表达水平相关。笔者研究发现,杨树基因组中表达序列和注释基因中(包括表达和不表达的基因)含微卫星的比例有明显差异,且表达序列含微卫星的比例低于全部基因的平均水平。由于含微卫星的基因表达水平偏低,会规避部分选
择压力,有利于相应基因在基因组中得以保存。含微卫星的基因表达水平较低可能是长期选择的结果,是含微卫星的基因在基因组中得以保存的一种
机制。
按Svetlana 等
[12]
对微卫星的划分,可将微卫
星分为两大类:长度\20bp 的SSR 为第1类,长度<20bp 的为第2类。与第2类SSR 相比,第1类SSR 具有更高的多态性,这一规律是W eber 最早于人类的微卫星实验数据中发现的,并已在很多生物体中
得到证实[15]
。微卫星的变异速率和微卫
星的长度有关[16-17]
,微卫星长度越长,变异速率越快,因而受到的选择压力也越大。该研究的结果显示,表达序列中的微卫星以长度较短的微卫星为主,第1类微卫星仅占微卫星总数的16163%,这一结果显示表达序列中的微卫星在进化过程中可能受趋同选择的影响。这些含有长微卫星的基因是否具有功能上的特殊性,是一个值得在未来研究中深入开展的课题。
许多研究都表明三碱基重复微卫星是目前为止基因编码区中发现最多的微卫星类型
[16-17]
,这
可能是由于密码子选择导致的结果,其他几种类型的重复单元重复次数的改变会导致阅读框的显著改变,导致基因表达截短或产生完全不同的蛋白。相对而言,三碱基突变对基因表达产物的影响相对较小,所以长期选择的结果会导致基因编码区中三碱基重复微卫星的数量明显高于其他类型的微卫
13
南京林业大学学报(自然科学版)第35卷
星。该研究结果显示杨树EST序列所含微卫星中,三碱基重复微卫星相对其他类型的微卫星显著富集,占发现微卫星总数的一半左右。由于三碱基重复单元重复次数的变化对基因读码框改变的影响较小,所以编码区序列对三碱基重复微卫星有更好的容受性,在选择作用下,会导致三碱基重复微卫星的富集。研究显示杨树基因组中编码区微卫星的发生频率仅为非编码区的1/3[7],M organte 等[17]也发现在氨基酸延伸的正向选择压力下,拟南芥、水稻、玉米、大豆、大麦和小麦6种植物中三碱基重复微卫星在编码区丰度是非编码区的2倍。笔者对杨树表达基因序列进行的分析结果也显示三碱基重复微卫星高度富集,而在杨树基因组非编码区中,以往研究结果显示微卫星则以二碱基重复为主[7]。这一现象也说明三碱基重复微卫星富集是基因区微卫星在基因组中得以保存的重要机制。因为遗传密码由3个碱基决定,三碱重复微卫星仅引起个别氨基酸的插入和缺失,不会引起整个读码框改变使编码产物发生显著异。表达序列中三碱基重复微卫星富集是遗传密码选择的结果。
参考文献:
[1]何平.真核生物中的微卫星及其应用[J].遗传,1998,20
(4):42-47.
[2]Thibodeau S N,Bren G,S chai d D.M i cros atellite instab ilit y i n
cancer of t h e prox i m al co l on[J].Science,1993,260(5109):
816-819.
[3]A alt onen L A,Lau riA,L eac h F S,et a.l C l u es t o t he pat hogen-薛璐种子
es i s of fa m ili al colorect a l cancer[J].S ci en ce,1993,260
(5109):812-816.
[4]IonovY,M i guelA,Pei nado,et a.l Ub i qu i tou s so m ati c mu tati on s
i n si m p l e rep eat ed sequen ces revea l a ne w mechan is m for co l on
carci nogenesis[J].Nat u re,1993,363:558-561.
[5]林武华,孙念绪.散发性结直肠癌与微卫星不稳定性的关系
[J].武警医学院学报,2003,12(3):231-233.[6]Po w ellW,M achray G C,Provan J.Pol ymorph is m revealed by
s i m p le sequence repeats[J].T rends i n Plant Science,1996,1
(7):215-22.
[7]L i S X,Y i n T M.M ap and ana l ysis of m icrosat ellit es i n t h e ge-
n o m e of P opulus[J].Sci en ce i n Ch i na P ress,2007,50(5): 690-699.
[8]L i S X,Y i n T M,W angM X,et a.l Characteri zati on ofm i cros a-
tellites i n t h e cod i ng regi ons of t h e Popu l us geno m e.M olec u lar
B reed i ng[J/OL].2009.DOI:1011007/s11032-010-9413-
5.h tt p://www. m/conten t/y86485k50j405470/.
[9]Tuskan G A,D iFazi o S,J an ss on S,et a.l The geno m e of b l ac k
cottonw ood,P o pu l u s tric h ocarpa(Torr.&G ray)[J].Science, 2006,313(5793):1596-1604.
[10]Je w ell E,Rob i n s on A,S avage D et a.l SSR pri m er and SSR tax-
ono m y tree:b i o m e SSR d iscovery[J].NuclAci d s Res2006,34: 656-659.
[11]李春善,王志和,王文林.生物统计学[M].2版.北京:科学出
版社,2000.
[12]S vetlana T,Gen evieve D,Angeli ka L,et a.l Co m putational and
exp eri m en t a l anal ys i s ofm i crosatellites i n ri ce(Oryza sativa L.):
frequ ency,lengt h variati on,transpos on associati ons,and gen eti c m arker potenti al[J].G eno m e R esearch,2001,11:1441 -1452.
[13]Tot h G,Gaspari Z,Jurka J.M icrosat ellit es i n d ifferen t eukaryo-t
i c gen o m es:s u rvey and analys i s[J].G eno m e R esearch,2000,
10(7):967-981.
[14]S treel m an J T,Kocher T D.M icrosat ellit e vari ation associat ed
喷嘴设计
w ith prolactin exp res s i on and gro w th of sal t c h all enged T ilap i a [J].Physiol og i ca lGeno m ics,2002,9(1):1-4.
[15]W eber J L.Infor mati veness of human(dC-dA)n(dG-dT)n
pol y m orph i s m s[J].G eno m ics,1990,7:524-530.
[16]KattiM V,Ran j ek ar P K,Gup taV S.Differen tiald istri buti on of
s i m p le sequence repeats i n euk aryotic genom e sequences[J].
M ol ecu l ar B iol ogy and Evo l uti on,2001,18(7):161-1167. [17]M organ teM,H anafeyM,Pow ellW.M icrosatelli tes are p referen-
ti all y associ ated w it h nonrepetiti ve DNA i n plant geno m es[J].
Nat u re Gen eti cs,2002,30(2):194-200.
(责任编辑郑琰燚)
14

本文发布于:2024-09-22 05:21:26,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/78941.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:微卫星   基因   表达   序列
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议