黄丹木姜子叶绿体基因组特征分析

53卷
收稿日期:2021-10-18
基金项目:国家自然科学基金项目(32060710)通讯作者:韩利红(1981-),/0000-0002-6127-0915,副教授,主要从事植物系统发育与进化研究工作,E-mail :hanli-****************第一作者:刘潮(1980-),/0000-0001-6811-2218,副教授,主要从事植物系统发育与进化研究工作,E-mail :liuchao_
**********
黄丹木姜子叶绿体基因组特征分析信托公司集合资金信托计划管理办法
潮,韩利红*,彭
悦,樊瑞卿,王宇默
(曲靖师范学院生物资源与食品工程学院/云南省高校特果酒技术创新与应用工程研究中心,云南曲靖
655011)
摘要:【目的】分析黄丹木姜子(Litsea elongata )叶绿体基因组特征,为木姜子属物种鉴定、遗传多样性分析和资源保护提供理论参考。【方法】基于Illumina HiSeq 2000高通量测序平台对黄丹木姜子叶绿体基因组进行测序,利用GeSeq 在线工具对叶绿体基因组进行注释,并利用REPuter 、MISA 、CodonW 和IQ-TREE 等生物信息学软件对其基因组结构、基因数目、序列重复、密码子使用偏性和系统发育进行分析。【结果】黄丹木姜子叶绿体基因组全长为154028bp ,具有典型的四分结构,编码126个基因,其中蛋白编码基因82个,rRNA 基因8个,tRNA 基因36个。叶绿体基因组的注释基因中,有9个基因含1个内含子,有3个基因含有2个内含子,其余基因均不含内含子;44个基因编码蛋白参与光合作用信号途径,21个基因编码蛋白构成了核糖体大小亚基。黄丹木姜子叶绿体基因组含有32对长序列重复和90个SSR 位点,其中,正向重复和回文重复最多,均为12对,反向重复和互补重复分别为6和2对;95.56%的SSR 位点位于单拷贝区[大单拷贝区(LSC )和小单拷贝区(SSC )],仅4.44%的SSR 位点位于反向重复区(IR )。黄丹木姜子叶绿体蛋白编码基因GC 含量为39.14%,GC3s 为27.95%,平均有效密码子数(ENC )为49.04,说明其密码子偏性弱;相对同义密码子使用度(RSCU )大于1.00的密码子31个,其中13个以A 结尾,16个以U (T )结尾。系统发育进化树分析结果显示,木姜子属的14个物种聚为两组,其中黄丹木姜子和10种木姜子属植物聚在一个组,与日本木姜子的亲缘关系最近。【结论】黄丹木姜子叶绿体基因组结构保守,偏好A 或U (T )结尾的密码子,鉴定的SSR 位点可用于物种鉴定和体遗传学研究。
关键词:黄丹木姜子;叶绿体基因组;SSR ;密码子使用性;系统发育分析中图分类号:S718.46
文献标志码:A
文章编号:2095-1191(2022)01-0012-09
优秀青年学者论坛
刘潮(1980-),副教授,主要从事植物系统发育与进化研究。利用分
子生物学、生物信息学、生态学等技术和手段,围绕云贵高原植物物种多样性与特物种基因功能等方面开展大量研究,为地方物种的保护与开发利用奠定了基础;并结合多种测序手段完成了地方特物种木棉和花魔芋的基因组测序工作,获得了高质量的基因组图谱。先后主持或作为主要成员参与国家自然科学基金项目、云南省基础研究计划项目、云南省地方本科高校(部分)基础研究联合专项等10余项。获授权国家发明专利2项,审定选育农作物品种1个,出版植物图鉴1部,在《GigaScience 》《Plant Diversity 》《南方农业学报》《林业科学》等国内外学术期刊上以第一作者或通讯作者发表论文30余篇。
1期·13·
0引言
【研究意义】黄丹木姜子[Litsea elongata(Wall. ex Nees) Hook.f.]为樟科木姜子属(Lit-sea)常绿乔木,在我国华中、华东、华南和西南地区广泛分布,在尼泊尔、印度等国家也有分布,常生于山坡路旁或灌丛中,其木材和种子具有重要的应用价值。叶绿体是植物重要的细胞器,拥有相对独立的遗传系统,尤其是高等植物的叶绿体基因组具有较高的保守性,但不同物种间又存在局部的变异,故叶绿体基因组被广泛应用于植物分类和进化研究(Song et al.,2017a;Tian et al.,2019;Song et al.,2020;Zhang et al.,2021)。因此,开展黄丹木姜子叶绿体基因组特征分析,对木姜子属物种鉴定、遗传多样性分析及资源保护具有重要意义。【前人研究进展】叶绿体作为光合作用场所,在绿植物生长发育和响应逆境过程中发挥作用(Pogson et al.,2015),因此,叶绿体基因组被广泛应用于樟科(Song et al.,2020)、双六道木属(Diabelia)(Wang et al.,2020)和
木兰属(Magnolia)(Dong et al.,2021)等植物系统进化分析、物种鉴定、遗传多样性分析等方面。研究发现,大多数陆生植物的叶绿体基因组大小无明显差异(120~160kb),并存在典型的四分结构,包括大单拷贝区(Large single copy,LSC)、小单拷贝区(Small single copy,SSC)和2个反向重复区(Inverted repeat,IR)(Wicke et al.,2011)。目前,樟科(Song et al.,2020)、锦葵科(Wang et al.,2021)、杨属(Zong et al.,2019)、双六道木属(Wang et al.,2020)、木兰属(Dong et al.,2021)、辣椒属(刘潮等,2022)等多个科属的植物叶绿体基因组序列特征得到解析。大部分陆生植物进化过程中存在叶绿体基因组内的基因丢失、增加、重排和重复,叶绿体基因组
中基因含量未发生显著变化(Wicke et al.,2011;Li et al.,2017;Song et al.,2017b;Li et al.,2021)。Song等(2020)利用120个樟科物种叶绿体基因组序列构建系统发育进化树,将樟科分为9个单系,木姜子属归为月桂—新木姜子组。基于解剖学、形态学和分子数据世界田径锦标赛
Characteristics of chloroplast genome of Litsea elongata
( Nees) Hook.f.
LIU Chao,HAN Li-hong*,PENG Yue,FAN Rui-qing,WANG Yu-mo
(College of Biological Resource and Food Engineering/Yunnan Engineering Research Center of Fruit Wine,Qujing
Normal University,Yunnan,Qujing,Yunnan655011,China)
Abstract:【Objective】Research of Litsea elongata( Nees) Hook.f.chloroplast genome possessed essential theoretical and practical significance for species identification,analysis of genetic diversity,and resource protec-tion of Litsea.【Method】The chloroplast genome of L.elongata was sequenced and annotated based on Illumina HiSeq 2000high-throughput sequencing platform.The chloroplast genome was annotated using GeSeq.The genome structure,g
ene number,repeats,codon usage bias,phylogenetic development were analyzed by using the bioinformatics softwares such as REPuter,MISA,codonW and IQ-TREE.【Result】The size of chloroplast genome of L.elongata was154028bp,with a typical quadripartite structure.The genome contained126genes,including82protein coding genes,8rRNA genes,and36tRNA genes.Among the annotated genes of chloroplast genome,nine genes contained one intron,three genes contained two introns.None of the remaining genes contained introns.Forty-four proteins were involved in the pho-tosynthetic signal pathway,and21proteins constituted large/small subunit ribosome.The chloroplast genome of L.elon-gata contained32long repeats,and90simple sequence repeats(SSR).Among them,the forward repeats(12)and palin-drome repeats(12)were the most,followed by the reverse repeats(6)and complementary repeats(2).95.56%of the SSR loci were located in the single copy regions[large single copy region(LSC)and small single copy region(SSC)],and only4.44%of SSR loci were located in the reverse repeat regions(IR).The guanine and cytosine(GC)content and synonymous third codons positions(GC3s)of chloroplast protein coding genes of L.elongata were39.14%and27.95%,respectively.And the average effective codon number(ENC)was49.04,indicating that the codon bias of the chloroplast genome was weak.There were31codons with relative synonymous codon usage(RSCU)was greater than1.00,of which13ended with A and16ended with U(T).Phylogenetic analysis showed that14Li
tseas pecies were clustered into two clades,and L.elongata gathered together with other ten Litsea species and shared the closest genetic relationship with L.japonica.【Conclusion】The chloroplast genome structure of L.elongata is conservative and prefers codons ending in A or U(T).The identified SSR loci can be used for species identification and population genetics.
Key words:Litsea elongata( Nees) Hook.f.;chloroplast genome;SSR;codon usage;phyloge-netic analysis
Foundation items:National Natural Science Foundation of China(32060710)
刘潮等:黄丹木姜子叶绿体基因组特征分析
53卷
南方农业学报
·14·
分析,发现木姜子属与山胡椒属植物在形态和分布上存在较多相似之处,基于核糖体ITS和叶绿体matK的分子系统分析显示,木姜子属与山胡椒属均表现为多系类(Li and Christophel,2000;Li et
al.,2004,2008)。【本研究切入点】目前,虽然樟科属间系统进化关系研究较多,而木姜子属内叶绿体基因组特征及系统进化关系有待进一步深入研究。【拟解决的关键问题】利用高通量测序技术对黄丹木姜子叶绿体基因组进行测序,以滇南木姜子(Lit-sea garrettii)叶绿体基因组为参照,对黄丹木姜子叶绿体基因组进行注释,并对基因组中序列重复、SSR位点及蛋白编码基因的密码子使用偏性进行分析,同时分析了木姜子属叶绿体基因组结构变异和系统发育关系,为黄丹木姜子及木姜子属植物资源开发与利用提供理论参考。
1材料与方法
1.1试验材料
黄丹木姜子新鲜叶片采自浙江省温州市吹台山森林公园,样品置于硅胶中保存,存放于中国科学院西双版纳热带植物园(标本号XTBG-BRG-SY36963)。
1.2叶绿体基因组测序及注释
利用改良的CTAB法从叶组织中提取黄丹木姜子改成基因组DNA(李金璐等,2013)。基于Illu-mina Genome Analyzer HiSeq2000测序平台完成叶绿体基因组测序。去除低质量测序片段,并使用GetOrganelle组装获得完整叶绿体基因组(Jin et al.,2020)。以滇南木姜子(L.garrettii)叶绿体体
基因组(GenBank登录号MN698967)为参照,利用GeSeq (https://chlorobox.mpimp-golm.mpg.de/geseq.html)对黄丹木姜子叶绿体基因组进行注释。使用OGDRAW v.1.3.1(https://chlorobox.mpimp-golm. mpg.de/OGDraw.html)绘制黄丹木姜子叶绿体基因组图谱(Greiner et al.,2019)。
1.3叶绿体基因组长序列重复和SSR位点分析
通过REPuter(Kurtz et al.,2001)分析长序列重复,搜索参数:最小重复长度为30bp,序列同源性为90%,Hamming距离为3,同时分析了正向(Forward,F)、反向(Reverse,R)、互补(Complementary,C)和回文(Palindromic,P)重复。利用MISA-web在线工具(Beier et al.,2017)检测SSR,最小阈值为单核苷酸重复次数10,二核苷酸重复次数5,三核苷酸重复次数4,四核苷酸、五核苷酸和六核苷酸重复次数均为3。1.4密码子偏性分析
使用CodonW1.4.2(http://codonw.sourceforge. net/)和EMBOSS网站(http://ulouse.inra. fr/)的cusp软件分析黄丹木姜子叶绿体基因组中基因的有效密码子数(Effective number of codon,ENC)和相对同义密码子使用度(Relative synony-mous codon usage,RSCU)(惠小涵等,2020)。
1.5系统发育分析
从NCBI和LCGD数据库下载木姜子属13个物种的叶绿体基因组。将近缘类樟(Cinnamomum camphora)和沉水樟(C.micranthum)设为外物种(Song et al.,2020)。使用MAFFT(Katoh et al.,2019)进行多序列比对,通过IQ-TREE(Minh et al.,2020)使用最大似然法(Maximum likelihood,ML)构建系统发育进化树,建树模型为GTR+F+R2,步长值为1000。
2结果与分析
2.1叶绿体基因组结构特征分析结果
黄丹木姜子叶绿体基因组大小为154028bp,具有典型的四分结构(图1),由LSC(93688bp)、SSC (18852bp)和2个IR(20744bp)组成。黄丹木姜子叶绿体基因组共含126个基因,包含82个蛋白编码基因,8个rRNA基因和36个tRNA基因,其中13个基因为双拷贝基因(3个为蛋白编码基因,6个tRNA基因,4个rRNA基因)(表1);总GC含量为39.17%,四个分区中,IR的GC含量最高,其次为LSC,SSC最低;基因编码区及tRNA和rRNA编码区的GC含量均大于50.00%,蛋白编码基因的GC含量与叶绿体基因组接近。
黄丹木姜子叶绿体基因组注释基因中,有9个基因含1个内含子,有3个基因含2个内含子,其余基因均不含内含子。44个基因编码蛋白参与光合作用信号途径,21个基因编码蛋白构成了核糖体大小亚基(表2)。
2.2叶绿体基因组序列重复分析结果
黄丹木姜子叶绿体基因组序列含有32对(64条)长序列重复,其中正向重复和回文重复最多,均为12对(24条),反向重复和互补重复分别为6(12条)和2对(4条)(图2-A)。定位于LSC的长序列重复占32.81%,定位于IR的长序列重复占53.13%,定位于SSC的长序列重复占14.06%。最长的重复(48bp)定位在LSC(图2-B)。长度为30bp的重复数目最多,其中回文重复5对,正向和反向重复均为4对,互补重复为2对(图2-C)。
1期
·15·
黄丹木姜子叶绿体基因组中有90个SSR 位点,共12种类型(表3),其中,单核苷酸SSR 位点数目最多,占72.22%,其次是二核苷酸SSR 位点,占11.11%,三核苷酸重复4个,四核苷酸重复9个,五核苷酸和六核苷酸重复均为1个(表3)。二核苷酸SSR 中AG/CT 和AT/AT 数目分别为4和6个,三核苷酸重复AAT/ATT 数目为4个,四核苷酸重复AAAT/ATTT 数目为5。77.78%的SSR 位点位于LSC ,17.78%的SSR 位点位于SSC ,仅4.44%的SSR 位点位于IR 。最长的SSR 序列为单核苷酸和六核苷酸重复,大小均为18bp 。黄丹木姜子叶绿体基因组SSR 序列偏好A/T 碱基。69.66%的SSR 位于基因间区,12.36%位于编码区序列上,17.98%位于内含子区(图3)。
类别Category 叶绿体基因组(bp )Chloroplast genome
基因组成(个)Gene component (gene )
GC 含量(%)GC content
参数Parameter
LSC SSC IR 基因组大小基因总数蛋白编码基因tRNA 基因数目rRNA 基因数目双拷贝基因基因组LSC SSC IR
蛋白编码基因tRNA 编码区rRNA 编码区
描述Description
936882074418852154028126823681339.1737.9644.3333.8839.1453.3155.16
图1黄丹木姜子叶绿体基因组结构分析结果Fig.1Complete chloroplast genome map of L.elongata
物探与化探
表1黄丹木姜子叶绿体基因组信息
Table 1Summary of the chloroplast genome of L.
elongata
刘潮等:黄丹木姜子叶绿体基因组特征分析
53卷
南方农业学报
·16·
表2叶绿体基因组注释信息
Table2Genes present in the chloroplast genome
基因类型Category of gene 光合系统Photosynthetical system
遗传复制系统Genetic replication system
其他基因
Other genes
分组
Group
ATP合酶
NADH氧化还原酶
光系统I
光系统II
细胞素
Rubisco大亚基
核糖体大亚基
核糖体小亚基
RNA聚合酶亚基
核糖体核糖核酸基
转运RNA编码基因
保守开放阅读框
脂肪酸合成酶
细胞素合成酶
动漫部落
碳代谢
翻译起始因子
成熟酶
蛋白酶
基因名称
Name of gene
atpA、atpB、atpE、atpF*、atpH、atpI
ndhA*、ndhB(×2)*、ndhC、ndhD、ndhE、ndhF、ndhG、ndhH、ndhI、ndhJ、ndhK
psaA、psaB、psaC、psaI、psaJ
psbA、psbB、psbC、psbD、psbE、psbF、psbH、psbI、psbJ、psbK、psbL、psbM、psbN、psbT、psbZ
petA、petB*、petD*、petG、petL、petN
rbcL
科学发展观论文摘要
rpl2*、rpl14、rpl16*、rpl20、rpl22、rpl23、rpl32、rpl33、rpl36
rps2、rps3、rps4、rps7(×2)、rps8、rps11、rps12(×2)**、rps14、rps15、rps16*、rps18、rps19
rpoA、rpoB、rpoC1*、rpoC2
rrn4.5(×2)、rrn5(×2)、rrn16(×2)、rrn23(×2)
trnA-UGC(×2)、trnC-GCA、trnD-GUC、trnE-UUC、trnF-GAA、trnfM-CAU、trnG-GCC、trnG-UCC、
trnH-GUG、trnI-CAU、trnI-GAU(×2)、trnK-UUU、trnL-CAA(×2)、trnL-UAA、trnL-UAG、trnM-CAU、
trnN-GUU(×2)、trnP-UGG、trnQ-UUG、trnR-ACG(×2)、trnR-UCU、trnS-GCU、trnS-GGA、trnS-UGA、
trnT-GGU、trnT-UGU、trnV-GAC(×2)、trnV-UAC、trnW-CCA、trnY-GUA
ycf1、ycf2、ycf3**、ycf4
作为生物的社会
accD
ccsA
cemA
infA
matK
clpP**
×2:表示双拷贝基因;*:表示基因包含1个内含子;**:表示基因包含2个内含子×2:Two gene copies;*:Genes with one intron;**:Genes with two introns
2.3叶绿体基因组密码子偏性分析结果
黄丹木姜子叶绿体蛋白编码基因GC含量为39.14%,GC3s为27.95%,平均ENC为49.04,表明其密码子偏性较弱。蛋白编码基因中RSCU大于1.00的密码子为31个(图4和表4),其中13个以A结尾,16个以U(T)结尾,以G和C结尾的各有1个,表明黄丹木姜子叶绿体基因组蛋白编码基因更偏好A和U(T)结尾的密码子,与较低的基因组和蛋白编码基因GC 含量一致。
2.4木姜子属植物系统发育分析结果
以樟和沉水樟为外类,基于ML法利用叶绿体基因组序列构建系统发育进化树,结果显示,14个木姜子属植物聚为两大组(图5)。其中,潺槁木姜子、尖脉木姜子和木姜子以100%的支持率聚在组Ⅰ,黄丹木姜子和其他10种木姜子属植物聚在组Ⅱ,黄丹木姜子与日本木姜子的亲缘关系最近。
3讨论
木姜子属植物包含大约400个种,分布于亚洲、中美洲、北美洲和太平洋岛屿的热带和亚热带森林中(Fijridiyanto and Murakami,2009)。黄丹木姜子分布广泛,其木材和种子均具有重要应用价值。植物叶绿体基因组的高保守性使其成为探究物种分类、遗传进化和谱系关系的理想工具(Song et al.,
2017b)。随着高通量测序技术的发展,樟科植物(Song et al.,2020)、双六道木属植物(Wang et al.,2020)以及大花君子兰(Clivia miniata)(郑祎等,2020)、四川山胡椒(Lindera setchuenensis)(刘潮等,2021)、高良姜(Alpinia officinarum)(黄琼林,2021)等大量植物叶绿体基因组序列被解析。与木姜子属其他物种类似(Zhang et al.,2021),黄丹木姜子叶绿体基因组具有典型四分体结构,各区GC含量差异较大,其中IR的GC含量较高,这与rRNA的GC含量较高,且全部定位在这些区域密切相关(Xiao et al.,2020)。黄丹木姜子叶绿体蛋白编码基因偏好A或U (T)
结尾的密码子,与樟(C.camphora)(秦政等,2018)、四川山胡椒(刘潮等,2021)和芝麻菜(Eruca sativa)(Zhu et al.,2021)等物种叶绿体基因组密码子使用性一致,可能与叶绿体基因组较低的GC含量有关,表明密码子偏好性可能受基因组GC含量的影响。密码子优化可提高基因翻译效率,密码子分析结果可为黄丹木姜子叶绿体转基因研究提供参考,根据叶绿体基因组的密码子偏好对目的基因进行优化,以提高基因转化和表达效率。
SSR常被用于物种鉴定、系统进化分析和体遗传学研究(Li et al.,2021;Zhu et al.,2021)。长序列重复区域存在高度多态性,在植物基因表达和调控中起着重要作用。本研究从黄丹木姜子叶绿体基

本文发布于:2024-09-21 11:03:59,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/428881.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:基因组   基因   黄丹   植物   分析
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议