微生物组测序分析包括菌结构谱、宏基因组和宏转录组,但是目前宏转录组研究较少。所以,本文介绍菌结构谱、宏基因组测序分析的主要步骤和预算,以助大家申请相关科研基金。
本文介绍三种模式:(1)单独的菌结构谱,即只研究菌种类和丰度,该模式的特点是所需资金少,但研究的深度浅;(2)单独的宏基因组,研究菌种类和丰度的同时,研究菌所携带的基因的功能和丰度,该模式的特点是研究的深度深,但所需资金多而且风险较大;(3)菌结构谱+宏基因组,该模式的特点是先投入较少的资金较大范围的筛选样品,然后从中挑出某些样本投入较多的资金深入研究,实现较深研究深度的同时规避风险。 如有疑问或想和深圳微生太科技有限公司合作,可以联系江舜尧。电话:133****0601,133****0601或173****9151。
第一部分 步骤和预算
第一种模式:单独的菌结构谱
1.1 步骤:
① 利用菌采样器(或其他工具,如冻存管)采集待测样本(如果样本是人类粪便,建议使用菌采样器采样,详细信息点击:一种基于菌采样器的粪便菌采样方法);
② 使用宏基因组 DNA 提取试剂盒提取样本(如粪便)中的总 DNA;
③ 以细菌16S rRNA 基因的V3~V4可变区序列为靶标,以带有barcode 序列的338F-806R为引物(或其他靶标和引物,见表1),进行 PCR 扩增,获取 PCR 产物;
表1 各种引物及其序列
测序类型 | 引物名称 | 引物序列 | 长度 | 测序平台 |
细菌16S rRNA | 515F | 5'- GTGCCAGCMGCCGCGG-3' | 392bp | PE250平台,土壤等环境样本推荐使用 |
907R | 5'- CCGTCAATTCMTTTRAGTTT-3' |
细菌16S rRNA | 338F | 5'- ACTCCTACGGGAGGCAGCAG-3' | 468bp | PE300平台,粪便等样本推荐使用 |
806R | 5'- GGACTACHVGGGTWTCTAAT-3' |
真菌ITS | 沈那遗址ITS5F | 5'- GGAAGTAAAAGTCGTAACAAGG | 300bp左右 | PE250平台,欲获得较丰富的种类者推荐使用 |
ITS1R | 5'- GCTGCGTTCTTCATCGATGC |
真菌18S | 547F | 5'- CCAGCASCYGCGGTAATTCC | 420bp | PE300醋酸甲脂平台 ,欲获得较准确的种类者推荐使用 |
V4R | 5'- ACTTTCGTTCTTGATYRA |
| | | | |
④ PCR 产物经过定量及文库构建后,利用 Illumina MiSeq PE300平台(根据实际情况调整)进行高通量测序,获取细菌16S rRNA 基因的V3~V4 可变区碱基序列信息(根据实际情况调整);
⑤ 利用 QIIME 软件,对测序序列进行质控及 OTU(分类学操作单元)聚类,OUT代表序列与Greengenes数据库(或其他数据库,见表2)进行比对分析,获取 OTU 对应的分类单元(包括门纲目科属种)及其相应的丰度信息;
表2 各序列比对数据库
测序基因 | 建议比对数据库 | 数据库网址 |
16S rRNA | Greengenes | / |
Silva | |
RDP | / |
18S rRNA | Silva | |
ITS | UNITE | / |
| | |
⑥ 计算 Chao1、ACE、Shannon 和 Simpson 等度量指数,评估样品中细菌菌的丰富度和均匀度;
⑦ 综合应用 PCA 分析、Metastats 分析、LEfSe 分析、ANOVA 方差分析等方法寻各组样品中的特征菌;
⑧ 应用 RDA 分析关联菌结构和环境因子(如动物生理生化指标),寻与环境因子(或动物病理生理特征)存在正相关或负相关的菌;
⑨ 应用PICRUSt 软件,预测各组样本菌的代谢功能,从中出有差异的组分。
1.2 预算:X*550元/例=Y元。建议单价按550-500元预算,样本多时,单价偏低,样本少时,单价偏高。该预算比市场价高,这样做是为了不至于被动。
表3 菌结构谱测序分析预算明细
加壳
实验步骤 | 单价(元) | 样本数 | 总价(元) |
DNA提取 | 50 | X | 50X |
PCR扩增 | 100 | X | 100X |
文库构建 | 80 | X | 80X |
测序 | 200 | X | 200X |
数据分析 | 120 | X | 120X |
共计(元) | 550X |
| | | |
注:
① 如果不是按550元做预算,记得调整明细。
② 如果样本是人类粪便,建议增加菌采样器的预算,每份样本用一个采样器,单价为55-50元(该预算比市场价高)。
③ 本预算按照从DNA提取到数据分析全外包的模式,这样外协检测费在标书总预算中会占比较高。如果一定要降低检测费比例,标书中做预算时可以将DNA提取费做成购买DNA提取试剂盒的费用,如美国Omega菌DNA提取试剂盒,2000元/盒,50次装(即理论上可以提取50份样品)。此部分可以加倍预算,即,如果需要提取100份样本,可以预算购买4个50次装的试剂盒。
第二种模式:单独的宏基因组
2.1 步骤:
① 利用菌采样器(或其他工具,如冻存管)采集待测样本(如果样本是人类粪便,建议使用菌采样器采样,详细信息点击:一种基于菌采样器的粪便菌采样方法);
② 使用宏基因组 DNA 提取试剂盒提取样本中的总 DNA;
③ 总 DNA 经过随机打断,连接接头和PCR扩增富集等处理,构建测序文库;
④ 利用 Illumina HiSeq 4000高通量测序平台进行宏基因组测序,获得样品宏基因组序列;
⑤ 测序原始数据质控后利用 SOAP denovo 组装软件进行组装,再利用 MetaGeneMark 软件进行 ORF(Open Reading Frame,开发阅读框)预测,经 CD-HIT 软件去冗余后获得非冗余基因集,采用SoapAligner 软件,综合应用各样本的测序数据,获得各样品中各基因的丰度表;
⑥ 从非冗余基因集出发,与 NCBI 的 NR 数据库进行比对,获得基因的物种注释信息,及物种丰度表;
⑦ 从非冗余基因集出发,进行代谢通路(KEGG),同源基因簇(eggNOG),碳水化合物酶(CAZy)的功能注释和丰度分析,获得基因功能丰度表;
⑧ 基于物种丰度表和功能丰度表,进行丰度聚类分析、PCA 分析、样品聚类分析、显著性差异分析(包括Metastats 和LEfSe)、代谢通路比较分析,挖掘各组样本之间的物种组成和功能组成差异,为进一步深入研究xxxxx提供支撑。
2.2 预算:Z*5500元/例=W元。建议单价按5500-5000元预算,样本多时,单价偏低,样本少时,单价偏高。该预算比市场价高,这样做是为了不至于被动。
表4 宏基因组测序分析预算明细
实验步骤 | 单价(元) | 样品数 | 总价(元) |
DNA提取 | 200 | Z maxthon3 | 200Z |
文库构建 | 600 | Z | 600Z |
测序 | 900 哄抢猪肉5人被拘 | Z | 900Z |
数据分析 | 3800 | Z | 3800Z |
共计(元) | 5500Z |
2013诺贝尔文学奖获得者 | | | |
注:
① 如果不是按5500元做预算,记得调整明细。