生信分析学习笔记-RNAseq(二)双端测序与单端测序

⽣信分析学习笔记-RNAseq(⼆)双端测序与单端测序
声明:本⽂部分内容和部分图⽚来源于⽹络。本⽂为⽣信⼩⽩学习笔记,不能保证专业名词和内容全部正确或权威。
电子签章技术下图为某⼀条RNAseq从数据预处理,序列回帖到数据可视化的⼯作流程,包含了较多的软件(Linux环境运⾏)和若⼲个包(R语⾔环境运⾏),本系列将按下图,对每⼀个步骤进⾏学习和理解。
某RNAseq分析流程
问题:
1.  单端测序和双端测序是什么意思?
2.  双端测序的read1和read2有什么关系?在后续的拼接和⽐对时是如何参与的?
3.  对⽐单端测序,双端测序的优势是什么?悬式绝缘子
Illumina测序⼯作原理
Illumina测序流程(宣传动画)包括四个主要的步骤:样品制备,cluster⽣成,测序和数据分析。
样品制备的⽅法有很多,所有的制备⽅法都是在DNA⽚段的末端加上接头(adaptor),通过简单的循环扩增,引⼊其他的序列模块。如,测序引物结合位点序列,标签序列(index),以及于流动槽上的oligo(寡核苷酸)结合的互补区域。
Clustering(簇⽣成)是指每个⽚段分⼦被等温扩增的过程。Flowcell(流动槽)是⼀块带有通道的玻⽚。每条通道的内表⾯都包被着两种不同类型的oligo(寡核苷酸序列)。杂交是由这两种oligo(寡核
苷酸序列)的其中⼀种开始的。这种oligo与⽚段的⼀条链上的接头区域互补,聚合酶产⽣已杂交⽚段的互补序列,接下来双链分⼦被变性,原始DNA链模板被洗掉,通过桥式扩增,可以将这些链进⾏克隆扩增。在这个过程中,⽬标⽚段DNA链弯曲后,接头区域与flowcell上第⼆种类型的oligo杂交。聚合酶产⽣互补链,形成双链桥结构。这个桥经过变性,产⽣该分⼦的两条单链拷贝,均固定在Flowcell上。该过程重复⽆数遍,且数百万个Cluster同时发⽣,以使所有⽚段被扩增。在桥式扩增后,反向链被切割并洗掉,只留下正向链。3‘末端被封闭以避免不必要的引物结合和扩增。
测序是从第⼀条测序引物延伸并产⽣第⼀条read(正向序列)开始的。在每个循环中,带有荧光标记的碱基竞争性地结合在不断延长的链中,每次只能结合上⼀个与模板序列互补的碱基。在每次碱基集合时,⽤光源激发Clusters发出特异的荧光信号,通过检测不同信号,可知正在
循环数决定了序列碱基读取的长度(是指每次读取的长度可能少于原链长度?)。合成的序列碱基排序。这个过程被称为边合成边测序技术。循环数决定了序列碱基读取的长度
每次读取的荧光波长以及信号强度共同决定了碱基识别。 对于⼀个特定的簇,所有相同的链被同时读取。在⼤规模并⾏检测的过程中,数亿个簇被测序。在正向序列测序完成后,测序产物被洗掉。在这个步骤中,引⼊index1测序引物,其与模板杂交,与正向测序过程相似,⽣成index1序列。在index序列完成后,测序产物被洗掉,且模板的3’末端的保护被去除。模板现在⼜发⽣弯曲,并与flowcell上的
另⼀个oligo结合。index2的读取⽅式和index1相同。聚合酶使DNA链沿着第⼆条oligo链延伸形成双链桥。这个双链DNA随后被单链化3‘末端被封闭。原始的正向链被切割并洗掉,只留下反向链。
第⼆条read(反向序列)的测序是从引⼊它的测序引物开始的。反向测序步骤与先前的正向步骤相同,反应反复进⾏。知道达到所需的测序长度。反向测序产物被洗掉。整个过程产⽣了数百万条序列,包含了所有⽚段。独特的index可帮助区分⽂库制备过程中混合的多个测序样本,可分离混合样品⽂库的序列。对每⼀个样品,每个碱基序列相似的⽚段会被聚类分在⼀起。正向和反向序列配对并连接起来,形成连续的序列。将这些连续的序列再与参考基因序列组⽐对,已检测鉴定变异。
双端测序可以⽤来解决那些⽐对结果不唯⼀的测序⽚段。
单端测序与双端测序氢氧焊接机
两者的区别存在于测序⽂库的构建⽅法上。
单端测序:Single-Read测序(Single-read)⾸先将DNA样本进⾏⽚段化处理形成200-500bp的⽚段,引物序列连接到DNA⽚段的⼀端,      单端测序:
烧烤箱
然后末端加上接头,将⽚段固定在flowcell上⽣成DNA簇,上机测序单端读取序列。该⽅式建库简单,操作步骤少,常⽤于⼩基因组、转录组、宏基因组测序。
双端测序:双端测序在DNA⽚段两端都加上接头,进⾏第⼀次测序,洗去模板链,将模块再原位置进⾏扩增,进⾏第⼆轮测序。
双端测序:
双端测序对⽐单端测序的优势
城乡信息一体化双端测序对⽐单端测序的优势:
该优势聚焦于测序中对测序长度的影响。Illumina测序的长度较短,单端测序对于不同位置重复出现的序列⽚段识别出相同的信息,这导致将该序列回帖⾄参考序列中时,导致⼀定的误差。⽽双端测序中,不同读段间的距离已知,即使对于重复出现的序列,双端测序也可推断出不同序列出现的位置,⼤⼤减少了序列回帖的误差。双端测序的序列信息往往可以得到较好的组装结果。
流水工艺品
另⼀个原因,所有的reads只能按照⼀个⽅向进⾏读取,这会导致测序的质量会随着读取长度的增加⽽下降。对于单端测序,其下游测序质量就会较低,⽽双端测序会从两个⽅向读取超过待测序列的⼀半。再根据两个序列重合部分进⾏拼接,读取序列的质量会由于单端测序的结果。      在双端测序得到的fastQ⽂件read1和read2中,均具有相同的ID,并在ID后加/1 或/2 进⾏区分。

本文发布于:2024-09-21 10:41:37,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/285628.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:测序   序列   双端   碱基   长度   读取
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议