硬骨鱼类线粒体基因系统发育信息效率分析_陈姝君

由于线粒体中不同基因的进化速度不同,所以对于脊椎动物系统发育研究而言,其所具有的系统发育信息也不同[1-2]。系统发育信息[3](Phylogenetic information )也称作系统发生信息,是用于估算生物有关类或亲缘关系远近的基因序列信息,一个基因所具有的系统发育信息的大小,可以通过该基因在重建系统发育树时的准确率来估算[3] 。自PCR 技术和直接测序方法的广泛应用后,线粒体DNA 成为了系统发育研究的可靠标记[3]。Zardoya 等[3] 对19种脊椎动物线粒体不同基因的进化速度进行研究后,将13个蛋白编码基因分为好、中、差3个组,好的一组包括ND4、ND5、ND2、Cyt b 和COI ,中等的一组包括COII 、COIII 、ND1和ND6,差的一组包括A TPase6、ND3、A TPase8和ND4L 。鱼类在动物进化过程中处于承先启后的重要地位[4]。日本学者Miya [5] 对已知分类关系的8种硬骨鱼类的线粒体不同蛋白质编码基因所含有的系统发育信息进行了研究后表明,13个蛋白编码基因含有的系统发育信息明显不同,大致分为非常好、好、中等、差和非常差5个类别,非常好的一组包括ND5、ND4、COIII 和COI ,好的一组包括COII 和Cyt b ,中等的一组包括ND3和 ND2,差的一组包括ND1和 A TPase 6,非常差的一组包括ND4L 、 ND6和 A TPase 8。这与Zardoya 等的观点有所差异,Miya 认为观察的普遍性还不能确认,需要进一步研究。关于鱼类线粒体各个基因的系统发育信息如何、鱼类线粒体不同基因的保守性及其在系统进化中所包含的信息如何、是否与其他脊椎动物相同等问题,以及Miya 和Zardoya 等在脊椎动物的研究结论能否适应于鱼类这个庞大的类、能否适应于鱼类目、科、属和种间的系统发育研究等尚需更深一步的研究。
本研究利用PCR 产物直接测序法测定圆斑星鲽(Verasper variegatus )和条斑星鲽(V . moseri )的线粒体基因组全序列,同时从GenBank 中下载硬骨
收稿日期:2006-11-20;修订日期:
2007-04-20.基金项目:国家自然科学基金项目资助(30571410);海洋经济实施科技推进平台与运行项目(2005-2007年). 作者简介:陈姝君(1981-),女,硕士研究生,研究方向:动物分子遗传学.通讯作者:赫崇波(1961-),男,博士,研究员,研究方向:分子遗传学. E-mail :hechongbo@hotmail
硬骨鱼类线粒体基因系统发育信息效率分析
陈姝君1,2,赫崇波2,木云雷2,刘卫东2,周遵春2,高祥刚2,丛林林1,
2
(1. 辽宁师范大学 生命科学学院,辽宁 大连 116029;2. 辽宁省海洋水产科学研究院,辽宁省海洋水产分子生物学重点实验室,辽宁省应用海洋生物技术开放实验室,辽宁 大连 116023 )
摘要:采用PCR 产物直接测序法获得圆斑星鲽(Verasper variegatus )和条斑星鲽(V .moseri )线粒体基因组的全部基因序列,并从GenBank 中下载已知分类地位相关鱼类的线粒体基因的核苷酸序列和蛋白
质氨基酸序列,用蛙、鸡、牛做外,采用NJ 和MP 法,重建鱼类的系统发育树。通过计算各个基因在重建系统发育树时的准确率,估算该基因所含有的系统发育信息。结果表明,从氨基酸序列和核苷酸序列以及在目、科、属综合分析,这些基因的系统发育信息大致分为好 (16S rRNA 、ND2、ND4、12S rRNA 、ND6、ND5)、中 (Cyt b 、COII 、COIII 、ND1、COI ) 和差 (ND3、ND4L 、ATP6、ATP8)3个组。在目阶元,当用核苷酸序列分析时,12S rRNA 、 16S rRNA 、 COII 、 ND4、 ND5 和ND6 最好,COI 、COIII 、 Cyt b 、 ND1 和 ND2 为中等,而 ND3、ATPase6、 ATPase8和ND4L 最差。当用氨基酸序列分析时,ND4和ND5 最好,ND1、ND2、 Cyt b  、ND6、COI 、COII 和 ND4L 为中等,ND3、ATPase6、COIII 和 ATPase8 最差。在科阶元,当用核苷酸序列时,12S rRNA 、16S rRNA 、 ND2 和ND6 系统发育信息最好;用氨基酸序列时,Cyt b 和ND2 最好。在属阶元,所有基因的核苷酸序列都具有很好的系统发育信息,而COII 、 ND4L 、ND1和ND3 的氨基酸序列系统发育信息最差。本研究结果有助于进一步利用线粒体基因研究分析鱼类系统进化关系。[中国水产科学,2008,15(1):12-21]
关键词:圆斑星鲽;条斑星鲽;硬骨鱼;线粒体;系统发育
中图分类号:S917.4   文献标识码:A    文章编号:
1005-8737-(2008)01-0012-10中国水产科学
Journal of Fishery Sciences of China
第15卷第1期2008年1月
3m公司
Vol.15  No.1January 2008
第1期13
陈姝君等:硬骨鱼类线粒体基因系统发育信息效率分析
1.2 相关种类线粒体基因序列获取
为了研究不同线粒体基因的进化信息水平,我们从GenBank中下载鲽形目(Pleuronectiformes)、鲈形目(Perciformes)、鲤形目(Cypriniformes)、鲑形目(Salmoniformes)、鲇形目(Siluriformes)、金眼鲷目(Beryciformes)、目(Lophiiformes)7个目共已知分类关系的27种鱼以及黄牛(Bos taurus)、红原鸡(Gallus gallus gallus)和马达加斯加彩蛙(Mantella madagascariensis)的线粒体蛋白质编码基因和12S rRNA、16S rRNA基因序列(表2)。1.3 数据整理分析
将30种脊椎动物的线粒体13个编码基因的氨基酸序列和核苷酸序列以及12S rRNA、16S rRNA基因核苷酸序列,按基因种类归类。用ClustalX 1.83[9]、MEGA3.0 [10]等软件,采用NJ法和MP法[11],以
牛、鸡和蛙作外,利用线粒体13个蛋白编码基因和12S rRNA、16S rRNA的核苷酸序列和13个蛋白质的氨基酸序列,分别重建27种鱼的系统发育树。在得到的30个核苷酸序列树(NJ法和MP法各15个)和26个氨基酸序列树中(NJ法和MP法各13个),分别计算和分析出了各个基因在目、科、属3个阶元的分类准确率和系统发育信息。
1.4 基因系统发育信息的估算
1.4.1 在目、科、属水平基因的信息计算 利用公式:分类准确率=正确分类个体数/总个体数×100%,以百分率形式分别统计出每个线粒体基因的核苷酸、氨基酸序列在目、科和属各个水平上分类准确率,准确率越高,表示基因的系统发育信息越好。把30种脊椎动物构建所得的56个系统树(MP 树和NJ树各28个)与已知分类情况相比较,将分类符合已知情况,且自展值在51以上的个体视为正确分类个体,不符合已知分类或自展值低于50的视为不正确分类个体。
鱼纲中已知分类关系的相关鱼类线粒体基因组序列,用蛙、鸡、牛做外,采用生物信息学分析软件,对鱼类的线粒体各个蛋白质编码基因和核糖体基因的保守性以及它们在目、科、属不同分类阶元的系统发育信息进行了比较和研究,为进一步利用线粒体基因序列进行鱼类的分类、进化和遗传多样性等研究提供参考数据。
1 材料与方法
1.1 圆斑星鲽和条斑星鲽线粒体基因获得
实验鱼取自辽宁省海洋水产科学研究院旅顺海珍品繁育中试基地。取其背部肌肉组织约500 mg,按常规酚氯抽提方法[6]提取总DNA。以GenBank 中的圆斑星鲽(GenBank Accession Nos:DQ242488、DQ242490、DQ242494、DQ242492、AY671919)和条斑星鲽(GenBank Accession Nos:DQ242489、DQ242491、DQ242495、DQ242493、AB207249)[7],以及石鲽(Platichthys bicoloratus,AB028664)的部分序列为基础,设计出8对扩增引物,对圆斑星鲽和条斑星鲽线粒体进行PCR扩增(表1)。利用扩增产物直接测序法和引物行走法(Primer walking)进行线粒体基因组测序(大连宝生物)。通过Blastn 同源保守序列搜索和Clustal X 和MEGA3.0 [8]和FastPCR v3.6 等软件,确定各个基因序列。
表1 圆斑星鲽和条斑星鲽线粒体扩增引物及PCR条件
Tab. 1 Oligo nucleotide primers for ampli fi cation and sequence Verasper variegatus and V. moseri mtDNA
引 物Primer
正向引物序列
Forward primer 5′ -3′
反向引物序列
正比例应用题
Reverse primer 5′ -3′
产物大小/bp
Length
扩增条件客房管理系统设计
PCR pro fi le (35cycles)
vm-CR-16S gtccagtgttcatgcaatggat aggatgtcctgatccaacatc  4 30096℃1′–60℃1’–72℃3′vv-ND5-Cyt b cgcattttctacatccagccag gatgcgccrttggcatgratgct  1 75096℃1′–60℃1’–72℃2′v-16S-COI cgcctgtttaccaaaaacatcgcctc ggtttcggtcygtyagtagyattg  4 10096℃1′–60℃1’–72℃3′v-COI-ND5agccggaatagtggggacaggcc ctggctggatgtagaaaatgcg7 30096℃1′–60℃1’–72℃5′v-ND5-Cyt b cgcattttctacatccagccag gatgcgccrttggcatgratgct  1 75096℃1′–60℃1'–72℃2′v-ND5actctagcaccatagtcgttgc agtatggctttgaagaaggcgtg  27096℃1′–60℃1'–72℃1′v-Cyt b-CR ctccctgc
cccctctaatatct actgatgagtgtcgtgttcggt  1 50096℃1′–60℃1'–72℃2′vv-CR-16S acgcagtgttcatacgatacgc aggatgtcctgatccaacatc  4 10096℃1′–60℃1'–72℃4′注:vv和vm分别代表圆斑星鲽和条斑星鲽的特异性引物;v-为圆斑星鲽和条斑星鲽的共用引物.
Note:vv and vm- represent primers for V. variegates seri,respectively;v-primer for seri and V. variegates.
14 第15卷
中国水产科学
1.4.2 总体基因系统发育信息的计算 由公式[12]
d t= 2[min(q r,q t)- r] +︱q r - q t︱计算出各个基因的核苷酸序列和氨基酸序列在目、科和属总体水平上的基因系统发育信息,以及在核苷酸序列和氨基酸序列总体水平上的基因系统发育信息。根据所计算出的值,确定线粒体各个基因的系统发育信息水平。公式中,d t表示新建的系统树与真实系统树距离值,该值越小,表示越接近真实的系统树,基因的系统发育信息越好。q r表示重新构建系统树的分支数,q t表示真实系统树的分支数,r表示重建系统树和真实系统树相同的分支数。
2 结果与分析
2.1 圆斑星鲽和条斑星鲽线粒体基因组序列
圆斑星鲽和条斑星鲽线粒体基因组全序列长度分别为17 273bp和17 588bp,序列已经提交到GenBank数据库中,序列号分别为DQ403797 和
表2 用于本研究的鱼类及外的分类地位及其序列号
Tab.2 Classi fi cation position and array number of samples used in this study
目Order
Family
Species序列号Acc. No.
鲽形目 Pleuronectiformes 鲆科Bothidae牙鲆Paralicthys olivaceus AB028664鲽科 Pleuronectidae
圆斑星鲽Verasper variegatus DQ403797*
条斑星鲽Verasper moseri EF025506*
鲈形目 Perciformes鲹科 Carangidae 日本竹荚鱼Trachurus japonicus AP003092大西洋竹荚鱼Trachurus trachurus AB108498黑尻鲹Caranx melampygus AP004445刺鲹Carangoides armatus AP004444
鲤形目 Cypriniformes 鲤科 Cyprinidae
鲤鱼Cyprinus carpio X61010
白鲫Carassius cuvieri AB045144鳅科 Cobitidae
台湾缨口鳅Crossostoma lacustre M91245
日本八须鳅Lefua echigonia AB054126
基础教育参考鲇形目 Siluriformes 鮰科Ictaluridae斑点叉尾鮰Ictalurus punctatus AF482987鲿科Bagridae拟鲿Psedobagrus tokiensis AB054127美鲇科Callichthyidae Corydoras rabauti AB054128
鲇形目 Salmoniformes 深海鲑科Bathylagidae深海鲑Bathylagus ochotensis AP004101银鱼科Salangidae小齿日本银鱼Salangichys microdon AP004109
鲑科 Salmonidae
虹鳟Oncothynchus mykiss L29771
大西洋鲑Salmo salar U12143
白鲑Coregonus lavaretus AB034824
美洲红点鲑Salvelinus fontinali AF154850
北极红点鲑Salvelinus alpinus AF154851
金眼鲷目 Beryciformes 金眼鲷科 Beryidae
红金眼鲷Beryx splendans AP002939
十指金眼鲷Beryx decadactylus AP004430高体金眼鲷科Anoplogastridae高体金眼鲷Anoplogaster cornuta AP004425
目Lophiiformes 单棘躄鱼科 Chaunacidae
阿部单棘躄鱼Chaunax abei AP004415
土佐单棘躄鱼Chaunax tosaensis AP004416黑角科Melanocetidae黑角鮟鱇Melanocetus murrayi AP004418
无尾目Anura树蛙科 Rhacophoridae 马达加斯加彩蛙
Mantella madagascariensis AB212225
鸡形目Galliformes雉科Phasianidae红原鸡Gallus gallus gallus AP003322 反刍亚目Ruminantia牛科Bovidae黄牛Bos taurus AY526085 * 为本研究测得序列.
* Sequences determined in this study.
第1期15
陈姝君等:硬骨鱼类线粒体基因系统发育信息效率分析
EF025506。这两个基因组均包含13个蛋白质编码基因、1个12S rRNA、1个16S rRNA基因、22个tRNA基因和一个控制区。它们的核苷酸组成、基因结构和排列顺序同其他硬骨鱼类线粒体基因组基本相似。圆斑星鲽和条斑星鲽线粒体13个蛋白质编码基因和2个rRNA基因的组成情况见表3。
可转换债券表3 圆斑星鲽和条斑星鲽线粒体基因组的基因组成
Tab. 3 Characteristics of Verasper variegatus seri mitochondrial genome
vb图书管理系统基因Gene name 核苷酸长度/ bp
'Nucleotide Size
氨基酸序列长度/aa
Sequence size of amino acids
转录链
Transcripted from
12S rRNA 949(948)H 16S rRNA    1 716H ND1    975324H ND2  1 046348H COI  1 557518H COII  691230H COIII  785261H ND3  349116H ND4L  297  98H ND4  1 381460H ND5  1 839612H ND6  522173L Cyt b  1 141380H 注:括号内为条斑星鲽数据,没加括号表示两者相同.
Note:Data in the parentheses seri.
2.2 系统树重建结果
首先把选择的30个物种,根据已知的分类情况确定出期望的标准系统树(图1A)。在所得到的56个系统树中,与期望的标准系统树最相近的系统树有16S rRNA和ND2(图1B和C),与期望的标准系统树差距最大的的系统树为ATPase8(图1D)。
2.3 系统树准确率分析
2.3.1 不同mt基因在目阶元的分类准确率 在目一级分类阶元,当用线粒体13蛋白编码基因和12S rRNA、16S rRNA基因的核苷酸序列构建系统关系树时,12S rRNA、16S rRNA、COII、ND4、ND5和ND6分类准确率最高,都是100%,COI、COIII、Cyt b、ND1和ND2次之,准确率在90%以上,ND3、ATPase6、ATPase8、ND4L最差,准确率在87%~90%。在用氨基酸序列建树时,ND4和ND5最好,准确率是100%,ND1、ND2、Cyt b、ND6 、COI、COII和ND4L次之,准确率在87%以上,ND3、ATPase6、COIII和ATPase8,最差,准确率为77%~83% (图2A和B)。
2.3.2 不同mt基因在科阶元的分类准确率 根据用15个基因的核苷酸序列和13个基因的氨基酸序列所构建的系统树中科之间准确率的计算结果,同样可以将15个基因分为好、中、差3组(图2 中的C和D):用核苷酸序列时,好的一组有12S rRNA、16S rRNA 、ND2和ND6,准确率为100%;中等的一组有Cyt b、ATPase6、ATPase8、COI、COII、COIII、ND3、ND4和ND5;差的一组有ND1和ND4L。用氨基酸序列时,Cyt b和ND2最好,准确率100%,COI、ND4、ND5、ND6、ATPase8、COII 和ND4L次之,COIII、ND3、ND1、ATPase6最差。
2.3.3 不同mt基因在属阶元的分类准确率 在属之间,用核苷酸序列分类时15个基因都准确,用氨基酸序列分类时(图2E),只有COII、ND4L、ND1、ND3不完全准确,其准确率分别为97%、97%、93%、93%。
2.3.4 核苷酸和氨基酸序列的d t值 在核苷酸水平上,对目、科和属3个阶元的分类进行综合计算后,在核苷酸水平上(图3 A)线粒体15 个基因的d t值由低至高依次为16S rRNA、ND6、Cyt b、ND2、12S rRNA、ND4、ND5、COII、COIII、COI、ND3、ND1、ATPase6、ND4L、ATPase8。
16 第15卷
中国水产科学
图1 系统发育树
A:期望的系统发育树,B:16S rRNA核苷酸序列构建的系统发育树,C:ND2核苷酸序列构建的系统发育树,D:ATPase8核
苷酸序列构建的系统发育树.
Fig.1 Phylogeny trees congstructed in present study.
A:Expected phylogeny trees;B:Phylogeny trees of 16S rRNA sequence;C:Phylogeny trees of ND2 sequence;D:Phylogeny
trees of ATPase8 sequence.
第1期17
陈姝君等:硬骨鱼类线粒体基因系统发育信息效率分析
图2 不同线粒体基因的分类准确率
A:核苷酸序列在目一阶元的准确率分析;B:氨基酸序列在目一阶元的准确率分析;C:核苷酸序列在科一阶元的准确率分
析;D:氨基酸序列在科一阶元的准确率分析;E:氨基酸序列在属一阶元的准确率分析.
Fig.2 Accuracy of phylogenetic analysis using different mt genes
A:Accurate rate analysis of nucleotide sequence in order;B:Accurate rate analysis of amino acid sequence in order;C:Accurate
rate analysis of nucleotide sequence in family;D:Accurate rate analysis of amino acid sequence in family;E:Accurate rate
analysis of amino acid sequence in genera.

本文发布于:2024-09-21 13:55:50,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/200789.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:基因   线粒体   序列   研究   分类   信息
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议