转录组荔枝Dof基因家族的鉴定及其表达

文章编号:1674 − 7054(2021)01 − 0007 − 08
转录组荔枝Dof 基因家族的鉴定及其表达
董 晨,魏永赞,王 弋,郑雪文,李伟才
(中国热带农业科学院 南亚热带作物研究所/农业部热带果树生物学重点实验室,广东 湛江 524091)摘    要: 单锌指DNA 结合蛋白(DNA binding with one finger ,Dof )是植物中特有的一类转录因子,在植物生长发育与非生物胁迫响应中发挥非常重要的作用。利用妃子笑荔枝果实发育RNA-seq 数据库,采用生物信息学分析方法,对荔枝Dof (LcDof )基因家族的基本理化特性,亚细胞定位,蛋白质保守结构域,进化关系等进行分析,同时对LcDof 基因家族在果实发育中的表达情况进行分析。结果表明:荔枝中包含有19个LcDof 基因家族成员,LcDof 编码蛋白范围在157~497个 氨 基 酸 残 基(Amino acid, aa ),对应的分子量为17.70~54.35 kDa ,等电点(pI )范围为4.49~9.42;预测LcDof 家族成员亚细胞定位均定位于细胞核。系统进化关系分析表明,LcDof 基因家族分为4组(Group Ⅰ~Group Ⅳ),LcDof 在不同发育阶段的表达模式不同,其中LcDof7、LcDof9、LcDof12、LcDof15在果肉不同发育时期表达量较高,而LcDof3、LcDof10、LcDof16、LcDof17、LcDof19表达量较低。
关键词: 荔枝;Dof 转录因子;基因家族;生物信息分析;表达分析中图分类号: Q 786; S 667.1            文献标志码: A
引用格式: 董晨,魏永赞,王弋,等. 转录组荔枝Dof 基因家族的鉴定及其表达[J]. 热带生物学报,2021, 12(1):7−14. DOI :10.15886/jki.rdswxb.2021.01.002
单锌指DNA 结合蛋白(DNA binding with one finger ,Dof )是一类植物特异性转录因子,由多基因家族编码。Dof 蛋白大约由200~400个氨基酸残基(Amino acid, aa )组成,Dof 蛋白含有2个主要的保守结构域:即N 末端具有高度保守DNA 结合域和位于C 末端的转录调控域[1]。Dof 蛋白N−末端的DNA 结合域由52个保守的氨基酸残基组成的CX2CX21CX2C 单锌指结构,基序中的4个Cys 残基和1个Zn 2+共价结合,Dof 蛋白的DNA 结合域与不同植物的启动子DNA 结合具有特异性,识别AAAG 或互补序列CTTT 基序作为核心序列元件[2],但是南瓜Dof 蛋白AOBP 为例外,AOBP 蛋白特异识别AGTA 序列[3]。位于C−末端的转录调控结构域的氨基酸序列不具有保守性,导致Dof 蛋白在植物生长发育过程中的功能的多样性。自从第一个Dof (ZmDof1)基因在玉米中克隆以来[4],迄今为止从单细胞藻类到高等植物,越来越多的Dof 基因被克隆鉴定或从基因组数据库中被预测出来。基于植物Gene bank 数据库已被鉴定的Dof 基因家族数目为拟南芥36个[5]、水稻30个[5]、玉米46个[6]、小麦31个[7]、大豆28个[8]、高粱28个[9]、马铃薯35个[10 − 11]、番茄34个[12]、菊花20个[13]、大白菜76个[14]、香蕉74个[15]、榴莲24个[16]、木薯45个[17]、辣椒33个[18]、葡萄25个[19]等,但目前关于荔枝Dof 基因家族的系统分析尚未见报道。本研究利用课题组妃子笑荔枝果肉不同发育时期的转录组测序数据,采用生物信息学方法在转录组水平上对Dof 基因家族进行系统鉴定,通过对Dof 基因家族基
本理化性质、保守结构域、系统进化和基因表达等进行分析,为进一步了解荔枝Dof 基因家族(LcDof )的功能提供理论参考。  收稿日期:2020 − 07 − 16    修回日期:2021 − 01 − 28
  基金项目:国家重点研发计划(2019YFD1000900);广东省自然科学基金(2018A030307012);国家荔枝龙眼产业技术
体系(CARS-33-21)
  第一作者:董晨(1981−),女,硕士,副研究员. 研究方向:果树生物学. E-mail :********************  通信作者:李伟才(1975−),男,本科,研究员. 研究方向:荔枝龙眼栽培生理. E-mail :***************
第 12 卷 第 1 期热 带 生 物 学 报
Vol. 12 No. 12021 年 3 月JOURNAL OF TROPICAL BIOLOGY Mar. 2021
8热带生物学报2021 年
1    材料与方法
1.1    材料妃子笑荔枝果肉材料取自中国热带农业科学院南亚热带作物研究所荔枝种植园。分别取妃子笑果肉发育的3个时期(花后35 ,56,70 d)的样品,3个生物学重复,迅速置于液氮中,用于后续实验。
1.2    LcDof鉴定与分析转录组测序委托广州基迪奥生物公司,利用Illumina HiSeqTM4000平台进行测序,对原始测序数据进行过滤、去接头和低质量值数据后,用reads组装软件Trinity 软件进行序列组装并获得Unigene 序列,共拼接组装获得61648个Unigenes。从植物转录因子数据库下载Dof转录因子序列作为探针,对本地妃子笑荔枝果肉转录组数据进行搜索,筛选出LcDof并利用SMART和Pfam 验证,删除不完整的基因。
1.3    LcDof生物信息学分析分别采用ProtParam、Plant-mPlc Sever、MEME和SMART在线软件对Dof基因家族的相应基本理化性质、亚细胞定位、保守基序、基序功能注释进行生物信息学分析。MEME参数设置:基序最大值设为15,基序长度范围为6~100个氨基酸,其他参数为默认值。将荔枝、拟南芥和水稻中的Dof氨基酸序列通过Clustal X 1.83进行多重序列比对,进一步通过MEGA6.0邻接法(neighbor joining,NJ)将比对结果构建系统发育树。进化树参数设置:P-距离(P-distance)模型,成对删除(pairwise deletion)空位选项,Bootstrap method取值1 000。
1.4    LcDof基因家族在不同处理花穗发育过程中的表达特征分析    Dof基因家族的表达数据基于课题
组前期构建的“妃子笑”果肉发育RNA-seq数据库中的表达数据的rpkm值,利用Heml热图软件将Dof基因家族的表达数据均一化处理后制作热图。
2    结果与分析
2.1    LcDof的鉴定以拟南芥和水稻的Dof基因家族序列为探针,采用本地blast方法对荔枝果实发育RNA-seq数据库进行比对检索,同时利用Dof为关键词在RNA-seq数据库直接搜索;将得到的数据结果进一步进行整合分析,去除冗余序列,得到20个Dof蛋白序列。随后采用SMART和Pfam在线软件对Dof蛋白序列进行保守结构域分析,最终获得19个Dof蛋白序列(表1)。Dof基因家族成员编号按照Dof序列在RNA-seq数据库中的Unigene ID号出现顺序编号(表1)。LcDof蛋白序列长度范围为157~497 aa,平均长度为330.68 aa,LcDof18蛋白序列最短,LcDof15蛋白序列最长;LcDof蛋白序列的分子量(MW)为17.70~54.35 kDa,平均分子量为35.95 kDa。LcDof等电点(pI)在4.49~9.42,19个Dof蛋白中有6个等电点小于7显酸性;13个等电点大于7显碱性;LcDof蛋白平均等电点大于7,表明LcDof为弱碱性,在碱性的亚细胞环境中发挥作用。分析LcDof家族不稳定指数发现,LcDof4/ 9/11/14蛋白不稳定指数<40,为稳定蛋白,其余均为不稳定蛋白。分析LcDof家族脂肪族氨基酸指数发现,Dof家族的脂肪族氨基酸指数分布在46.2~66.32范围,脂肪族氨基酸指数与蛋白的热稳定性相关,表明Dof家族蛋白质间的热稳定性存在差异。LcDof家族蛋白质疏水性指数(Grand average of hydropathicity,GRAVY)均<0,表明LcDof家族蛋白均为亲水性蛋白。亚细胞定位预测结果表明,Lc
Dof蛋白均定位于细胞核,这与转录因子定位于细胞核结果相符。
2.2    LcDof蛋白的保守基序为了进一步了解 LcDof蛋白结构特征,利用MEME在线软件分析19个LcDof蛋白的保守基序,不同保守结构域在LcDof的位置如图1所示。LcDof基因家族中含有15个保守基序,并将得到的15个保守基序进一步进行功能注释(表2)的结果表明:15个基序中基序1出现在所有的蛋白质中,为N−末端高度保守的锌指结构域(zinc-finger Dof domain,zf-Dof),基序8、15为低密度复杂区,其余的12个基序没有对应的注释,功能未知。虽然荔枝Dof基因家族成员均含有基序1,但是LcDof基因家族成员之间包含的保守基序数目及种类存在一定的差异,其中LcDof2、LcDof15和LcDof16含有的基序数目最多,均含有11个保守基序;LcDof13含有8个基序;LcDof3、LcDof6和LcDof11均含2个基序(motif 1和motif12);LcDof8、LcDof9和LcDof17均含2个基序(motif 1和
motif14)。LcDof4仅含有1个基序。在进化树中关系较近的LcDof 成员间有类似的保守基序,如GroupIV 中的LcDof2、LcDof15和LcDof16。LcDof 中保守结构域组成相似的成员可能具有相近的基因功能。
表 1    荔枝Dof 基因家族信息Tab. 1    Litchi Dof gene family information
基因
Gene
湖北会计学会Unigene ID
Dof domain 结构域
蛋白序列长度Amino acids length/aa 分子量Moleculer weight/kDa 等电点PI 不稳定指数Instability index 脂肪族氨基酸
指数
Aliphatic index
疏水指数
GRAVY
亚细胞定位Subcellular localization LcDof1Unigene001034550~10834938.248.7361.6758.4−0.63细胞核 Nucleus LcDof2Unigene0013981118~17646951.02  6.3360.657.63−0.787Nucleus.LcDof3Unigene001450821~7928432.22  4.4949.8360−0.624Nucleus.LcDof4Unigene0015472
37~95
21421.82  4.6126.9155.14−0.341Nucleus.LcDof5Unigene001991743~10128931.918.6951.8559.72−0.75Nucleus.LcDof6Unigene002026229~8733636.737.1849.5350.21−0.882Nucleus.LcDof7Unigene0022097
27~85
30233.308.342.7655.23−0.719Nucleus.LcDof8Unigene002314047~10531634.878.7941.4554.91−0.734Nucleus.LcDof9Unigene0025055
26~84
26427.178.4436.4753.52−0.376Nucleus.LcDof10Unigene002538269~12732535.099.3264.4164.25−0.617Nucleus.LcDof11Unigene002765147~10531034.22  6.3539.553.16−0.669Nucleus.LcDof12Unigene0027696
21~79
27430.139.2647.0952.26−0.756Nucleus.LcDof13Unigene003246398~15649553.63  5.6643.8265.37−0.526Nucleus.LcDof14Unigene0033612
18~76
23724.828.4535.9749.83−0.64Nucleus.LcDof15Unigene0033960135~19349754.35  6.0655.3246.2−0.923Nucleus.LcDof16Unigene0034259146~20449554.338.2749.6853.8−0.824Nucleus.LcDof17Unigene005096769~12734036.118.9353.6566.32−0.513Nucleus.LcDof18Unigene0059627
40~98
15717.709.4247.1250.25−0.896Nucleus.LcDof19Unigene006017585~143
330
35.37
9.34
53.43
57.58
−0.632
脱氧核糖Nucleus.
Name  LcDof 1  4.24e−519.34e−2802.10e−470motif1motif9
motif10
motif11
motif12
motif13
motif14
motif15
motif2motif3motif4motif5motif6motif7motif8
50100150200250300350400450
23-value Motif location
图 1    LcDof 基因家族成员保守基序分析
不同颜方块代表不同的保守基序
Fig. 1    Distribution of conserved motifs in the LcDof gene family members
Different color squares represent different conservative motifs
第 1 期董    晨等: 转录组荔枝Dof 基因家族的鉴定及其表达
9
2.3    Dof 蛋白的多重序列比对及其进化关系    通过对荔枝Dof 基因家族19个家族成员进行多重序列比对,抽取保守结构域进行观察分析(图2),发现19个LcDof 蛋白结构域高度保守,均包含CX 2CX 21CX 2C 保守基序,构成了C2-C2型单锌指结构(Zinc-finger )。为进一步了解Dof 基因家族在荔枝中的进化关系和生物学功能,分别以荔枝19个Dof (LcDof )、拟南芥中36个Dof (AtDof )和水稻中的30个Dof (OsDof )蛋白序列构建系统进化树 (图3)。聚类结果表明:19个荔枝Dof 家族成员分别聚为4个亚家族(Group I-Group IV )个,其中GroupIV 中含有LcDof 基因家族成员数最多,有7个LcDof ,分别
表 2    LcDof 蛋白保守基序及功能注释
Tab. 2    LcDof protein conserved motifs and functional annotations
基序Motif 基序长度/bp Motif length 基序序列Motif sequence
1995年高考语文第一题>s11306
功能注释
Function annotation
150CPRCBSTNTKFCYYNNYNLSQPRHFCKTCRRYWTKGGTLRNVPVGGGCRK
zf-Dof 232ERCVLVPKTLRIDDPDEAAKSSIWATLGIKND 未知340GGGLFKGFQPKSDEKNRIAETSPVLQANPAALSRSLNFHE
未知434HHPSLKSNGTVLSFGSDAPLCDSMASVLNLADKK
未知521EQSESSESQEKTLKKPDKIJP 未知624YPWNPPVPPPAFCPPGFPMPFYPA
未知717AAHYRHITISEALQTAR
未知
849ENGDDHSNGSSVTVSNSKEEGGKTAMQEPLMQNYQGFPPQIPCFPGPPW
low complexity 低密度复杂区
914YWGCTIPGSWNMPA
未知108IKLFGKTI
未知1121PGSGPNSPTLGKHSRDENALK
未知1211ERKLRPQKEQA 未知1317MVFPSVPLYLDPPNWQQ
未知146FDHHHH
未知
15
43
FPLQDFKPTLNFSJDGLGNGFGSLNGVQENGTGRLFFPFEELK
low complexity 低密度复杂区
LcDof  1Dof domain
:::::::::::::::::::
:56565656565656565656565656565656565656
::::::::::::::::::LcDof  2LcDof  3LcDof  4LcDof  5LcDof  6LcDof  7LcDof  8LcDof  9LcDof  10LcDof  11LcDof  12LcDof  13LcDof  14LcDof  15LcDof  16LcDof  17LcDof  18LcDof  19C1C2
C3C4
ldsZinc-finger
图 2    LcDof 基因家族成员保守结构域
Fig. 2    Conserved domain of LcDof gene family members
10热 带 生 物 学 报
全面推开营改增2021 年
为LcDof2、LcDof4、LcDof9、LcDof13、LcDof15、LcDof16、LcDof18,占基因家族总数的36.84%。其次为Group I ,含有LcDof 基因家族成员数最多,有6个LcDof ,分别为LcDof1、LcDof3、LcDof7、LcDof11、LcDof12和LcDof15,占基因家族总数的31.58%。第三为Group II ,含有5个LcDof 基因家族成员,占基因家族总数的26.32%,分别为LcDof6、LcDof10、LcDof14、LcDof17、LcDof19。Group III 含有LcDof 基因家族成员最少,仅有1个LcDof8,占基因家族总数的5.26%。荔枝Dof 家族成员与拟南芥Dof 家族成员在进化上亲缘关系较近,而与水稻Dof 家族成员关系较远,其中AtDof2.1和LcDof7,AtDof1.4和LcDof1,AtDof5.4和LcDof6,AtDof1.2和LcDof3为直系同源基因,推测以上荔枝中Dof 与拟南芥的Dof 在生物学功能上相似。LcDof5和LcDof12,LcDof10和LcDof19,LcDof4和LcDof9,LcDof2和LcDof15为旁系同源基因,推测荔枝Dof 转录因子经历了基因复制事件,有可能存在功能的冗余。
2.4    荔枝Dof 家族基因的表达    为研究荔枝Dof 基因家族在荔枝果实不同发育时期的表达情况,利用妃子笑荔枝(果肉不同发育时期)的RNA-Seq 转录组数据库,到候选的19个Dof 基因对应转录本的RPKM 值,然后用Heml 热图软件对LcDofs 的RPKM 值取对数值转换制作聚类热图(图4)。图4显示,在果肉发育的不同时期均检测到19 个LcDof 基因的表达,但表达丰度不同;其中LcDof7、LcDof9、LcDof12、LcDof15在果肉不同发育时期表达量均较强,而LcDof3、LcDof10、LcDof16、LcDof17、LcDof19
Group Ⅳ
Group Ⅰ
Group Ⅱ
Group Ⅲ
图 3    荔枝Dof 、拟南芥Dof 和水稻Dof 的邻接法系统发生树
不同的形状表示不同的物种,圆形代表来自荔枝的Dof 蛋白(LcDof );正方形形代表来自水稻的Dof 蛋白(OsDof );三角形代表来自拟南芥的Dof 蛋白(AtDof ),不同颜分支代表不同的亚家族。
Fig. 3    Neighbor-joining phylogenetic tree of Dof in litchi, Arabidopsis  and rice
Different shapes represent different species. The circle represents the Dof protein from litchi; the square represents the Dof protein from rice; the triangle represents the Dof protein from Arabidopsis thaliana ; different color branches represent different subfamilies.
第 1 期
董    晨等: 转录组荔枝Dof 基因家族的鉴定及其表达11

本文发布于:2024-09-21 20:36:38,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/143747.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:基因   保守   蛋白   基序   荔枝   序列   进行   转录
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议