OTU聚类与注释

毫米波
OTU 聚类与物种注释
一、OTU聚类
江西省煤矿设计院
1.1  为何要进行OTU聚类
a)测序完成后,每例样品的测序序列达到几万条,对每一条序列当然都可以进行物种注释,但这种
方式工作量大,毕竟每一条序列均需要与数据库进行比对、比对过程又比较耗时,而且扩增、测序等过程中出现的错误会降低比对结果的准确性。
b)因此,在微生物多样性研究中,引入了OTU的概念,首先对序列按照一定的相似程度进行聚类,
每形成的一类称为一个OTU,一个OTU中序列的差异程度不能大于规定的相似程度,基于分类单元(OTU)进行物种注释(即从OTU中选择一条代表序列与数据库进行比对获得分类地位信息,便是该OTU的分类地位信息),
c)如此操作,不仅简化工作量,提高分析效率,而且OTU在聚类过程中还可以去除一些错误的序列,
如嵌合体序列,提高分析的准确性。
1.2  OTU的概念
➢OTU(Operational Taxonomic Units)是在系统发生学研究或体遗传学研究中,为了便于进行分析,人为给某一个分类单元(品系,种,属,分组等)设置的同一标志。
➢在生物信息分析中,一般来说,测序得到的每一条序列来自一个菌株。要了解一个样品测序结果中的菌种、菌属等数目信息,就需要对序列进行归类操作(cluster)。通过归类操作,将序列按照彼此的相似性分归为许多小组,一个小组就是一个OTU。
1)细菌16S多样性研究中,目前主要按照序列97%的相似性进行OTU聚类✓主要原因:在16S全长比对中,97%相似性可以认定为同一个种,所以可以初步认为一个OTU都是属于一个种的微生物,而细菌16S研究中,解释度最可靠的分类学地位是“属”,所以97%相似度划分OTU可以被接受。
招贴设计论文
2)OTU相似度的选择可以通过如下方式进行选择
✓将序列按照梯度相似度(如:70~99%之间)分别进行OTU聚类,将不同相似度的OTU数量进行统计,当在某一相似度时,OTU数量出现拐点时,即为最合适的聚类相似度。
✓因此,在早期16S多样性研究中,也有使用96%和98%相似度进行OTU聚类的。
✓在功能基因多样性研究中,聚类相似度浮动会比较大,不同的功能基因,聚类相似度在80%左右,甚至30%左右。
1)细菌16S 多样性研究中,目前主要按照序列97%的相似性进行OTU 聚类
✓主要原因:在16S 全长比对中,97%相似性可以认定为同一个种,所以可以初步认为一个OTU 都是属于一个种的微生物,而细菌16S 研究中,解释度最可靠的分类学地位是“属”,所以97%相似度划分OTU 可以被接受。2)OTU 相似度的选择可以通过如下方式进行选择
✓将序列按照梯度相似度(如:70~99%之间)分别进行OTU 聚类,将不同相似度的OTU 数量进行统计,当在某一相似度时,OTU 数量出现拐点时,即为最合适的聚类相似度。
✓因此,在早期16S 多样性研究中,也有使用96%和98%相似度进行OTU 聚类的。
谭旭光博客
钼电极
✓在功能基因多样性研究中,聚类相似度浮动会比较大,不同的功能基因,聚类相似度在80%左右,甚至30%左右。0200
压电陶瓷超声换能器
400600
80010001200
70%80%85%90%93%94%95%96%97%98%99%100%拐点

本文发布于:2024-09-22 18:12:19,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/578329.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

上一篇:光核反应
下一篇:通信阶段作业
标签:进行   序列   相似   聚类
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议