烟草EST数据库构建及盐胁迫下烟叶基因表达谱分析

农业生物技术学报 Journal of Agricultural Biotechnology2008,16(4):662~669
*基金项目: 云南省烟草公司科技计划项目(No.0515)和国家自然科学基金项目(No.30560062)资助。
**通讯作者。Author for correspondence.教授, 主要从事植物分子生物学研究。E­mail:<Lidb@mail.>.收稿日期: 2007­09­03接受日期: 2007­10­16·研究论文·
烟草 EST数据库构建及 cDNA阵列技术建立 *
李文正 1, 宋利民 1, 李永平 1, 卢秀萍 1, 骆红梅 2, 戴承恩 3, 方永启 3, 董海涛 3, 李德葆 3 **
(1.云南省烟草科学研究所, 玉溪 653100; 2.杭州师范大学生命与环境科学学院, 杭州 310036;
3.浙江大学生物技术研究所, 杭州 310029)
摘要:一组容量为 5927条烟草 ( ) EST的数据 (GenBank登录号为 CV015900~CV021826), 包含 521个 重叠和 3079个独立 EST。 EST数据分析显示: 高丰度表达基因主要涉及光合代谢、 蛋白合成等植物基本的生理功能; 而低丰 度表达基因则占假定独立转录本 (TUTs) 总数的85.5%。 在此基础上, 制备完成 cDNA阵列, 并应用于盐胁迫下烟叶的基因表达 谱分析, 结果表明, 盐胁迫
即可使烟草叶片的基因表达谱发生显著改变, 并涉及多个重要的植物生理过程。包括水通道蛋白 PIP2a、 乙烯应答蛋白酶和 mRNA剪接因子 等42个基因的检出, 为阐明植物胁迫反应的调控机制提供新的线索。
关键词:烟草; 表达序列标签; cDNA阵列; 实时定量 PCR
中图分类号: S188 文献标识码:A 文章编号: 1006­1304(2008)04­0662­08
Construction of EST Data Base and Establishment of cDNA Array
LI Wen­zheng 1 ,SONG Li­min 1 ,LI Yong­ping 1 ,LU Xiu­ping 1 ,LUO Hong­mei 2 ,DAI Cheng­en 3 ,
FANG Yong­qi 3 , Dong Hai­tao 3 ,LI De­bao 3 **
A cDNA library consisting of5927high quality sequences was sequenced(GenBank accession No.: CV015900~CV021826) .By analyzing the EST sequences,the proportion of genes were identified at EST level.A cDNA array was constructed based on the tentative unique transcripts(TUTs)derived from EST assembling results.A total of42differentially expressed genes were identified including plasma membrane intrinsic protein2a,ethylene­responsive proteinase,and Pre­mRNA splicing factor
gene etc.,suggesting that there was a complicated biological procession in under saline
stress.
;expression sequence tags(EST); cDNA array;quantitative real­time PCR
植物在自然界遇到环境条件的剧烈变化,其幅 度超过了植物正常生活的范围,这种变化称为逆境 或胁迫 (Shinozaki and Yamaguchi­Shinozaki,2000; Zhu,2001)。 其中, 盐胁迫是一种化学胁迫, 可产生细 胞质膜透性或运输、 代谢过程的变化, 也可导致营养 缺乏、膨压降低、脱水以致植物生长受到抑制 (Bohnerta .,2001;Zhu,2001)。植物受盐胁迫及 耐盐的分子机制一直是植物学家关注的热点,其研 究材料也多种多样,烟草则一直是研究植物胁迫生 理的重要模式作物之一(Bonnet ,1996;Hon伢 e ,1995)。由于烟草易于组织培养,也容易得到再生 的转化植株, 故人们先后将一些其它生物与抗病、 抗 虫、 抗旱、 抗盐、 抗冷、 抗热、 抗除草剂以及光合作用、 营养元素的吸收利用等相关的转录因子或功能基因 转入烟草 (Ozturk ,2002;Keller ,1999), 并 获得了相应性状得到改观的转基因烟草,显示出烟 草作为研究材料所具有的代表性和易操作性。
本研究首先构建完成一个烟草均一性 cDNA 文库,并应用大规模 EST测序技术,获一组烟草 EST的数据集。在此基础上, 开发完成烟草高通量 cDNA阵列检测技术,应用于盐胁迫下烟叶的基因 表达谱分析。 这些 EST数据集和相应技术体系的建 立可为研究植物抗逆抗病机制提供物质基础,所获 的盐
胁迫下烟叶基因表达谱特征也可为阐明植物胁
第 4期 李文正等:烟草EST数据库构建及 cDNA阵列技术建立
迫反应的调控机制提供新的线索。
1材料和方法
1.1 植物材料
构建 cDNA文库的烟草供试材料由 13个种 (品种)组成,分别是野生种 Link&
Otto(花烟草)、 Gray(克利夫兰氏烟 草)、 L.(黏烟草)、
Viviani (蓝茉莉叶烟草)、 Lehmann (香 甜烟草)
、 烟草和 L.(黄花烟 草); 栽培品种撒姆逊 (香料烟)、 B21(白肋烟)、 G80、 NC82及中国地方品种红花大金元、云 85和云烟 201, 均由云南省烟草科学研究所提供。成苗移栽于 大田生长至大十字期, 分别取根、 茎、 叶等量混合后, 用于总 RNA的提取。
烟草盐胁迫实验的供试品种为云 85, 由云南省 烟草科学研究所提供。营养液漂浮育苗在日光大棚 温室中进行。2006年 5月中旬, 云 85包衣种子播于 烟草专用的育苗漂浮盘中培养,营养液为霍格兰 (HOAGLAND) 培养液 (Hewitt, 1965)。 水培 70d后 选取 8~10叶期烟草植株, 置于含 200mmol/L NaCl 的霍格兰培养液中胁迫处理 3h,取第 2叶为材料, 以正常培养的 8~10叶期植株为对照,平行取样后 置液氮保存, 用于总 RNA的提取。另取同批次的烟 草植株用于光合参数测定。
1.2 主要试剂
Trizol R RNA抽提试剂为 GIBCO­BRL公司 (USA) 产品。DNase玉、 Sephacryl R S­400Matrix、 限 制性内切酶( 玉和 玉)、 T 4 DNA连接酶、 DNA聚合酶和 1kb DNA ladder均为 Promega公司 (USA) 产品 。 SuperScriptTM域逆转录酶为 Invitrogen公司 (USA) 产品。质粒 DNA抽提试剂盒 和 N+尼龙膜为 Millipore公司 (USA) 产品 。 DYEnamic TM测序试剂盒为 GE Healthcare公司 (USA) 产品。其它化学试剂均为分析纯。
1.3 总 RNA抽提及 cDNA文库构建
总 RNA抽提按 TRIzol R试剂盒操作方法进行, 总 RNA经 DNase玉处理以去除痕迹量 DNA, 以 Trizol R试剂重处理后, 1%甲醛变性凝胶电泳鉴定
RNA完整性,并以
260定量 RNA浓度后作均一化 调整。cDNA文库构建采用 SuperScriptTM域逆转 录酶合成 cDNA第一链, 所用引物为:
5'端: 5'­AACATATGCGGCC GCATTATGGC CGGG­3';
3'端: 5'­GATCTTCCACGCGTCGAC(T)30(A GC) (ATGC) ­3'。
取 cDNA第 1链为模板 , 以 5'端引物 (5'­AACATATGCGGCCGCATTATGG­5')和 3'端引 物(5'­GATCTTCCACGCGTCGACT­3')进行 PCR扩 增, 获 cDNA双链。PCR循环参数为:95℃变性 10 s; 60℃退火 45s, 共 16个循环。以 玉和 玉酶 切 PCR产物后,过柱 Sephacryl R S­400Matrix, 以 去除分子量小于 400bp的 cDNA片段。 分级分离后 的 cDNA片段与含相同粘性末端的 pBluescript SK (+)载体(Stratagene, USA)线性 DNA进行连接反应。 采用 Gene Pulser Xcell TM电击仪(Bio­Rad,USA)将连 接产物转化至大肠杆菌 ( ) DH5琢。 1.4 重组质粒抽提和 cDNA测序
转化产物经稀释后,涂布于含氨苄青霉素(100滋 g/mL)的麦康凯平板培养12h。 随机挑取100个白 菌斑, 以PCR扩增检测插入片段长度, 扩增引物为: M13正向:5'­CCCAGTCACGACGTTGTAAAA CG­3';反向:5'­AGCGGATAATTTCACACAGG­3'。
以 1%琼脂糖凝胶电泳鉴定产物分子量大小。 挑取白菌斑置每孔含 1mL LB培养液(g/L: 10蛋 白胨,
5酵母膏, 10NaCl, pH7.0;附加氨苄青霉素 至 100滋 g/mL)的 96孔深孔板中, 37 ℃振荡培养 18 h(200r/min),按质粒抽提试剂盒操作程序抽提 DNA,共随机挑取 9600个重组子以制备质粒 DNA。按 DYEnamic TM测序试剂盒说明书,以 M13反向引物 PCR扩增后,置 MegaBACE TM 1000自动 测序仪(GE Healthcare) 序列分析。
1.5 EST序列的生物信息学处理
EST原始序列用下列流程处理: (1)以 Phred程 序(Ewing ,1998)读取原始 ABI序列文件, 转换 成文本文件。(2)SeqClean软件(www.tigr. org/tdb/tgi/software/)去除低质量序列,包括来自载 体、 线粒体、 细菌基因组、 接头和核糖体 rRNA序列。
(3)TGICL(TIGR Gene Index Clustering tools)的 megablast程序(Pertea ,2003)对初步处理后的 EST(长度逸100bp)进行聚类。(4)用 CAP3软件 (Huang and Madan,1999)对聚类结果进行组装。(5)将 TUT序列与 UniProt数据库 (Apweiler , 2004)作 BLASTx比对(Altschul .,1990),给出功 能注释 ( <10 ­5 ),并在 MIPS(Munich Information Center for Protein Sequences)功能分类数据库 (Mewes ,2002)中给定一个功能分类描述。
1.6 cDNA阵列和杂交探针制备
选取非冗余 cDNA克隆, 以 M13通用引物进行 PCR扩增,获独立基因的 PCR产物用于 cDNA阵 列制备, 纯化后的 PCR产物由点样仪(Genomic So­
663
农 业 生 物 技 术 学 报 2008年
lution,USA)以直径 0.4mm的 384针印刷于 N +尼 龙膜,每个矩阵含 25(5伊 5)个点,每个 cDNA样品平
行 2次点样构成复本。
不同样品的 RNA经 DNase玉处理以去除痕迹 量 DNA,经 Trizol R试剂重新抽提后电泳鉴定 RNA 完整性,采用 260定量并对不同来源的 RNA样品
的浓度作均一化调整。以处理完成的总 RNA为模
板, Oligo(dT)16和 6N为引物,在逆转录酶 Super­
Script TM域 (Invitrogen)的催化下, 合成 cDNA第 1链,通过掺入 33 P­dCTP(Amersham,UK)标记为探
针。标记反应完成后,过柱 Sephedex­G50去除
33 P­dCTP单体。
1.7 分子杂交和数据分析
cDNA阵列在杂交前经紫外交联(60mJ/cm 2 )处 理,杂交方法及相关缓冲液按文献(Sambrook and Russell, 2001) 进行。磷屏(Kodak,Japan)放射自显影 72h后,扫描仪 Typhoon9200(MD,USA)提取杂交 信号, 以软件 ArrayVision6.0(MD)转换成均一化数 值。 每个探针设置 3次独立实验, 两组不处理样品间 基因表达差异采用改进的 检验(visitor.ics.u­ ci.edu/genex/cybert/)统计完成。 本研究所认定的差异 表达基因其信号强度值须同时满足以下条件:(1)在 0.01置信区间;(2)一对数据中任意一组杂交信号强 度平均值逸0.20;(3)差异表达倍数逸2.00。
1.8 实时荧光定量 PCR
待测 RNA样本以 Oligo(dT)16为引物,在反转录
酶 SuperScript TM域催化下合成 cDNA第 1链为 PCR模板, 平行检测 5个下调表达及所有 4个上调 表达基因表达量差异。通过设置 3次平行的独立实 验,以 基因为内参对照,计算出待测样品相 对表达量, 最终确定基因表达水平的变化趋势,以验 证微阵列杂交结果的可靠性。荧光定量 PCR试剂 盒、
定量 PCR仪及引物设计软件均为 Bio­Rad公司 (USA) 产品。
1.9 光合生理指标测定
采用 LI­6400型光合作用测定仪(LI­COR Inc援,
USA), 选取盐胁迫处理 3h的烟草第 2叶测定光合 参数, 并平行测定正常培养的植株第 2叶为对照。 将 待测叶片置红蓝光源叶室 (温度 28 ℃, 光强为 1000滋 mol/m 2 /s, CO 2浓度为 385滋 L/L) 中, 分别测定光合 速率、 气孔导度、 蒸腾速率和胞间 CO2浓度。每组各 设置 3株烟草为重复样本, 每株测定 3次。 数据处理 采用 SPSS13.0(/) 软件进行统 计学分析。
2结果和分析 2.1 cDNA文库的质量鉴定
根据细菌计数法推断该 cDNA文库的细菌浓 度约为 1.5伊 l0 5个/mL。将文库培养液均匀涂布于 麦康凯平板上, 可检测到其重组率约为 80%。随机 挑选 192个 cDNA克隆进行 PCR扩增, 获得 163个 特异性扩增产物,以 1%琼脂糖凝胶电泳检测插人 片段的大小,图 1是其中 24个 PCR产物的电泳结 果, 从中可估算出文库外源 cDNA片段的平均长度 约为 1.2kb,表明 cDNA文库插入片段的长度能够 保证烟草基因的完整性。
图 1.重组子的 PCR检测
Fig.1.PCR identification of recombinants
1~24, 检测克隆; M, 1kb DNA分子量标记。
1~24, detected clones;M,1kb DNA ladder.
2.2 基因注释及统计结果
从制备完成的烟草均一化 cDNA文库中随机 挑取 9600个 cDNA克隆进行 5'端定向测序, 用 Phred程序剔除载体和低质量序列(重复序列和含有 3%以上模糊序列的序列),最终得到 5927条高质 量 EST序列 (长度逸100nt)。统计结果显示 (表 1), EST平均测序长度为 351nt, 52%以上 EST序列长 度大于 400nt。采用 TGICL程序对所有 ESTs进行 拼接(assemble)并形成 clusters, 将每一个 cluster称 作一个假定独立转录本(tentative unique transcript, TUT), 上述 EST序列共拼接出 3600个 TUTs, 包含 521个重叠 (contigs) 和 3079个独立 EST (singletons)。共 29个重叠在 EST库中出现 15次 以上, 参照 Trail(2003) 的标准, 这些 TUTs可 归为高丰度表达重叠,代表该文库中高丰度表达 基因。将这 3600个 TUTs与 UniProt数据库作 BLASTx比对 ,约 31.95%TUTs具功能注释 (臆 10-5 )(表 2)。依据 Mips功能分类系统, 可将注 释基因细分为 18个功能类别 (表 3)。
2.3 cDNA
阵列数据分析
664
第 4期 李文正等:烟草EST 数据库构建及 cDNA 阵列技术建立
表1 EST 数据的总结 Table 1Summary of ESTs data
表2 TUT 序列 BLASTx 比对结果 Table 2BLASTx results of TUTs
1)TUT 序列的BLASTx 比对结果据 值分成高同源( 臆10 ­20
)、 中 同源(10 ­20 < 臆10 ­10 )、 低同源(10
­10 < 臆10 ­5 )和无同源( >10 ­5
)。 1)The TUT sequence matches were divided into highly significant (E
臆10
­20 ),moderately significant (10 ­20 < 臆10 ­10 ),weakly significant (10 ­10 < 臆10 ­5 )and not significant ( >10 ­5
)classes according to the
expect ( )values of BLASTx hit sequences.
序列同源性匹配 1) Sequence matches
显著匹配Significant matches  高 High  中 Moderate
低 Weak
无明显匹配No significant matches  总 TUTs All TUTs
TUT 数 Number of TUTs 1150 696 300 154 2450
3600
百分率 /% Percent
31.95 19.33 8.33 4.27 68.05 100.00
1)处理后序列长度大于或等于100bp 的 EST 数;2)冗余度=冗余 EST 数(总 EST 数-TUT  数)/总 EST 数。
1)Number of ESTs with length not less than 100bp;2)Redundancy = number of redundant ESTs/total number of ESTs.
EST 概要 EST summary
EST 总数Total number of ESTs
1) EST 平均长度/bp EST mean length
冗余度/%Redundancy 2) TUT  总数Number of TUTs
独立EST Singletons (1EST) 重叠Contigs (≥ 2ESTs) 2~5ESTs 6~10ESTs 11~15ESTs ≥ 16ESTs
数据 Data 5927 351 48.1 3600 3079 521 426 462029
百分率/% Percent
100 85.5 14.5 11.8 1.3 0.6 0.8
表 3 EST 数据的 MIPS 功能分类统计结果
Table 3MIPS functional classification of the ESTs from
cDNA library
功能类别
Functional category
1)
能量Energy  新陈代谢Metabolism  蛋白合成Protein synthesis
亚细胞定位Sub­cellular localization
蛋白折叠、 修饰和定位 Protein folding,modification and destination  细胞传导及传导机制Cellular transport and transport mechanism  细胞防御及毒性Defence and virulence
细胞的组成来源Biogenesis of cellular components  转录Transcription  结构的Structural
细胞分裂和DNA 加工Cell cycle and DNA processing  信号转导Signal transduction mechanism
细胞组成环境互动Interaction with the cellular environment  运输易化Transport facilitation  贮存蛋白Storage protein  无分类蛋白Unclassified protein  总数Total
TUTs 总数 TUTs number 196 126 219 137 8363344022129 5 4 4 2 14970
ESTs 总数 ESTs number 831 572 369 261 136 113 106 852524107 7 5 2 182571
冗余度/% Redundancy
degree
2)
4.24 4.54 1.68 1.90 1.64 1.79 3.12 2.12 1.14 2 1.11 1.4 1.75 1.25 1 1.28 2.65
比例/% Percentage in annotated ESTs 32.32 22.25 14.35 10.15 5.27 4.39 4.12 3.31 0.97 0.93 0.39 0.27 0.27 0.19 0.08 0.70 100.00
1)根据 MIPS  数据库进行的功能分类; 2)冗余度=ESTs 数目/TUTs 数目。
1)Category were assigned according to MIPS functional catalogue database;2) Redundancy degree=number of ESTs /TUTs of a given category.
根据 EST  序列分析结果, 按统计的 3600 个独 立基因(TUTs )数据选取非冗余 cDNA  克隆, 以 M13 通用引物进行 PCR  扩增。PCR  产物经琼脂糖 凝胶电泳鉴定,获代表 3503 个独立基因的特异性 PCR  片段用于 cDNA 阵列制备。 为验证 cDNA 阵列
的可靠性, 随机选取 384 个上述的 PCR  产物进行 3' 端重测序,
阳性测序结果和 cDNA  克隆的原始 EST  序列完全一致,表明所制备的 cDNA  阵列数据准 确, 可用于后续研究。
cDNA 阵列杂交的对照组其 3 次独立实验的相
665
农 业 生 物 技 术 学 报 2008 年
表达量差异显著的 cDNA 克隆cDNA clone with significantly different expression
基因数/ 个 信号强度范围Range of signal intensity
2)
差异倍数范围 Number  对照组 200mmol/L Range of f Control NaCl 3h old change  上调表达基因(总)Up­regulated genes  未知基因Unknown gene
下调表达基因(总)Down­regulated genes  光合作用Photosynthesis  电子传递和膜相关能量储存
Electron transport and membrane­associated energy conservation
细胞核Nucleus
细胞传导及传导机制Cellular transport and transport mechanisms  染体结构组成Organization of chromosome structure  细胞拯救、
防御、 毒性Cell rescue,defense and virulence  预测蛋白Hypothetical protein 3'末端加工 3'end process
未分类Unclassified  未知基因Unknown gene
4 4 38 2 2 2 2 1 1 2 1 124
0.26~0.79 0.97~1.82 0.48~0.92 0.64~0.94 0.37~1.08 0.05 0.61 0.22~0.26 0.38 0.03 0.16~1.60
0.54~1.63 0.41~0.86 0.22~0.42 0.31~0.38 0.17~0.37 0.02 0.22 0.01~0.10 0.18 0.015 0.07~0.78
2.01~2.17
-(2.11~2.36) -(2.17~2.20) -(2.08~2.48) -(2.14~2.93) -2.59 -2.73
-(2.20~22.02) -2.04 -2.15
-(2.03~2.62)
关系数 R 2
分别为 0.99、 0.96 和 0.97,NaCl  胁迫组则 分别为 0.97、 0.99和 0.97, 显示出杂交实验具良好的
重复性 (图 2)。这些 cDNA 阵列杂交的原始数据可 从本研究组网络数据库 (/array/) 查 看或下载。
2. 对照组和200mmol/L NaCl  处理 3h
的杂交信号值散点图
Fig.2.Scatter plot comparing the cDNA array hybridization
signal values between control and 200mmol/L
NaCl treatment for 3h
2.4 NaCl  胁迫下烟叶基因表达谱差异
以对照组为参比,NaCl  胁迫组其表达丰度差 异倍数≥ 2.00 的基因共 42 个,占总检测基因数的
1.17%。表 4 列举出上下调表达基因分类的总体状 况, 几点值得关注:(1) NaCl  胁迫下, 烟草叶片的基 因表达谱的变化趋势是以受抑制表达为主,相应于 38 个基因下调表达,
仅 4 个基因上调。这些基因的 功能涉及代谢、 呼吸链、 细胞周期和 DNA  处理、 蛋 白合成和处理、
细胞转运等多个植物生理过程。(2) 一些持家基因的表达丰度显著下调,如 Ubiquitin 、
Ubiquinol­cytochrome C reductase  和 Histone H2B  基 因等,显示出植物最基本的生理活动受到了抑制。 (3)显著下调的基因还包括 2 个与植物光反应相关
的基因 ,
Photosystem  域 10kD polypeptide  和 oxygen­evolving enhancer protein 1 基因,它们的产 物均为光系统域 受体复合物的组成部分, 定位于叶 绿体基粒片层膜,
可接受光能用于光合作用。(4) 多 个膜转运蛋白基因的表达量明显受抑,特别是水通 道蛋白 PIP2a (plasma membrane intrinsic protein 2a )
基因显著下调,与 NaCl  胁迫下植物的生理反应密 切相关。
(5)多达 2/3 数量的差异表达基因功能未 知, 其中 4个上调表达基因均为未知功能基因。 2.5 Q ­PCR  验证实验
为验证 cDNA 阵列杂交数据的可靠性, 将用于
表 4 对照组和 200mmol/L NaCl 处理 3h 表达量差异显著的注释基因分析
Table 4Analysis of significantly expressed genes between control and 200mmol/L NaCl treatment for 3h
1)根据MIPS 功能分类数据库进行分类; 2)微阵列上杂交信号强度标准化后的平均值。
1)Categories were assigned according to MIPS functional catalogue database by gene ontology annotation;2)Mean signal intensity after global normalization.
类别 Category
1)
666

本文发布于:2024-09-20 19:35:41,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/91643.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:基因   表达   烟草   植物   序列
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议