质粒基因组测序及比较基因组方案

质粒基因组测序及比较基因组方案
一、项目背景
质粒在细菌遗传物质中属于比较活跃的成分,部分细菌通过质粒上的部分基因来实现抗性或致病等生物学功能。同时,也有部分物种间的基因交流也是通过质粒完成的。研究质粒基因组,可以为细菌间快速进化、环境适应性及平行基因转移等领域提供切入点。
本方案的目的,就是通过多个质粒的测序及比较分析,解析多个物种之间质粒在基因结构层面的差异。
二、实验设计深圳职业技术学院图书馆
2.1 质粒DNA提取
建议按照文献方法,使用Qiagen试剂盒提取,保证质粒的质量和纯度。本步骤由老师完成。
2.2 文库构建
将质粒DNA分别打断成500bp及5k长度的DNA片段,分别用于构建小片段文库和Mate-pair文库。
2.3 上机测序人大释法
采用HiSeq2500平台,PE125测序,每个文库保证至少1G Raw data。
三、基因组拼接及注释
3.1 数据质控
对原始数据进行质控,去除低质量数据,具体原则如下:
1) 正常GC(35%-65%)物种:去除质量值≤20的碱基数达到一定程度的reads(默认40%);异常GC物种:去除质量值≤2的碱基数达到一定程度的reads(默认20%);
2) 去除含N的碱基数目总和达到一定比例的reads(默认10%);
3) 去除adapter污染(默认adapter序列与read序列有15 bp的overlap);
4) 去除duplication污染。
在过滤低质量数据的基础上,要将reads比对至质粒宿主的染体基因组上,到来自细菌染体的序列,并将这些序列移除,避免染体序列对拼接带来的干扰。
3.2 数据拼接
使用SOAPdenovo短序列组装软件对Clean Data进行组装,经多次调整参数后获得最优组装结果;然后reads将比对回组装获得的Contig上,再根据reads的paired-end 和overlap关系,对组装结果进行局部组装和优化。
软件:SOAPdenovo;版本:2.04
相关网站:sourceforge/projects/soapdenovo2/files/SOAPdenovo2/
对于质粒,我们利用小片段文库,可以得到质粒的绝大部分区域序列,剩余区域可以通过PCR walking的方式补充完整。
我们也提供基因组圈图绘制服务,如文献中的展示形式:大气气溶胶
3.3 基因组成分分析
使用GeneMarkS软件进行编码基因预测,通过RepeatMasker软件进行分散重复序列预测,通过TRF软件预测DNA序列中的串联重复序列。
软件:GeneMarkS;版本:4.6b
相关网站:topaz.gatech.edu/
软件:RepeatMasker;版本:3-3-0
相关网站:/
软件:Tandem Repeat Finder;版本:4.04
相关网站:tandem.bu.edu/trf/trf.html
3.4 基因功能注释
功能注释通常使用同源比对的方法,通过基因预测得到目标物种的氨基酸序列,并与已知的蛋白数据库进行比对,把目标物种的基因和其相对应的功能注释信息结合起来,得到注释结果,以推测它们的结构、功能以及进化上的联系。
目前我们提供注释的蛋白库为:
Kyoto Encyclopedia of Genes and Genomes(KEGG);
Cluster of Orthologous Groups of proteins(COG);
Swiss-Pro;
TrEMBL;
NR;
Gene Ontology (GO);
Pathogen Host Interactions (PHI);
Antibiotic Resistance Genes Database (ARDB);
Virulence Factors of Pathogenic Bacteria (VFDB);
卡茨Carbohydrate-Active enZYmes Database (CAZy);
其中高亮的数据库是我们默认采用的数据库,其他数据库可以根据需要自选。杨振宁
浦东高桥镇小学
根据部分数据库的注释结果,可以对样品的功能基因分类做一些统计,如下图:
四、质粒重测序
考虑到几段质粒之间序列相似度较高,可以基于一个精细图的样品,使用reads mapping的方法,对其余样本进行重测序分析。
4.1 序列质控及变异检测
序列质控部分,与之前3.1采用同样的方法和指标。
有效测序数据通过BWA软件比对到参考基因组上,比对结果经SAMTOOLS去除重复,并使用SAMTOOLS检测个体的SNP及小片段InDel信息。
具体结果展示如下:
4.1.1 基因组覆盖情况评估
用于评估reads对基因组整体的覆盖情况,如下图所示:

本文发布于:2024-09-23 02:28:02,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/472711.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:质粒   序列   基因组   基因   进行   注释   软件
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议