首页 > 专利信息

生信分析学习笔记-RNAseq(二)双端测序与单端测序

⽣信分析学习笔记-RNAseq（⼆）双端测序与单端测序

声明：本⽂部分内容和部分图⽚来源于⽹络。本⽂为⽣信⼩⽩学习笔记，不能保证专业名词和内容全部正确或权威。

电子签章技术下图为某⼀条RNAseq从数据预处理，序列回帖到数据可视化的⼯作流程，包含了较多的软件（Linux环境运⾏）和若⼲个包（R语⾔环境运⾏），本系列将按下图，对每⼀个步骤进⾏学习和理解。

某RNAseq分析流程

问题：

1. 单端测序和双端测序是什么意思？

2. 双端测序的read1和read2有什么关系？在后续的拼接和⽐对时是如何参与的？

3. 对⽐单端测序，双端测序的优势是什么？悬式绝缘子

Illumina测序⼯作原理

Illumina测序流程（宣传动画）包括四个主要的步骤：样品制备，cluster⽣成，测序和数据分析。

样品制备的⽅法有很多，所有的制备⽅法都是在DNA⽚段的末端加上接头（adaptor），通过简单的循环扩增，引⼊其他的序列模块。如，测序引物结合位点序列，标签序列（index），以及于流动槽上的oligo（寡核苷酸）结合的互补区域。

Clustering（簇⽣成）是指每个⽚段分⼦被等温扩增的过程。Flowcell（流动槽）是⼀块带有通道的玻⽚。每条通道的内表⾯都包被着两种不同类型的oligo（寡核苷酸序列）。杂交是由这两种oligo（寡核

苷酸序列）的其中⼀种开始的。这种oligo与⽚段的⼀条链上的接头区域互补，聚合酶产⽣已杂交⽚段的互补序列，接下来双链分⼦被变性，原始DNA链模板被洗掉，通过桥式扩增，可以将这些链进⾏克隆扩增。在这个过程中，⽬标⽚段DNA链弯曲后，接头区域与flowcell上第⼆种类型的oligo杂交。聚合酶产⽣互补链，形成双链桥结构。这个桥经过变性，产⽣该分⼦的两条单链拷贝，均固定在Flowcell上。该过程重复⽆数遍，且数百万个Cluster同时发⽣，以使所有⽚段被扩增。在桥式扩增后，反向链被切割并洗掉，只留下正向链。3‘末端被封闭以避免不必要的引物结合和扩增。

测序是从第⼀条测序引物延伸并产⽣第⼀条read（正向序列）开始的。在每个循环中，带有荧光标记的碱基竞争性地结合在不断延长的链中，每次只能结合上⼀个与模板序列互补的碱基。在每次碱基集合时，⽤光源激发Clusters发出特异的荧光信号，通过检测不同信号，可知正在

循环数决定了序列碱基读取的长度（是指每次读取的长度可能少于原链长度？）。合成的序列碱基排序。这个过程被称为边合成边测序技术。循环数决定了序列碱基读取的长度

每次读取的荧光波长以及信号强度共同决定了碱基识别。对于⼀个特定的簇，所有相同的链被同时读取。在⼤规模并⾏检测的过程中，数亿个簇被测序。在正向序列测序完成后，测序产物被洗掉。在这个步骤中，引⼊index1测序引物，其与模板杂交，与正向测序过程相似，⽣成index1序列。在index序列完成后，测序产物被洗掉，且模板的3’末端的保护被去除。模板现在⼜发⽣弯曲，并与flowcell上的

另⼀个oligo结合。index2的读取⽅式和index1相同。聚合酶使DNA链沿着第⼆条oligo链延伸形成双链桥。这个双链DNA随后被单链化3‘末端被封闭。原始的正向链被切割并洗掉，只留下反向链。

第⼆条read（反向序列）的测序是从引⼊它的测序引物开始的。反向测序步骤与先前的正向步骤相同，反应反复进⾏。知道达到所需的测序长度。反向测序产物被洗掉。整个过程产⽣了数百万条序列，包含了所有⽚段。独特的index可帮助区分⽂库制备过程中混合的多个测序样本，可分离混合样品⽂库的序列。对每⼀个样品，每个碱基序列相似的⽚段会被聚类分在⼀起。正向和反向序列配对并连接起来，形成连续的序列。将这些连续的序列再与参考基因序列组⽐对，已检测鉴定变异。

双端测序可以⽤来解决那些⽐对结果不唯⼀的测序⽚段。

单端测序与双端测序氢氧焊接机

两者的区别存在于测序⽂库的构建⽅法上。

单端测序：Single-Read测序(Single-read)⾸先将DNA样本进⾏⽚段化处理形成200-500bp的⽚段，引物序列连接到DNA⽚段的⼀端，单端测序：

烧烤箱

然后末端加上接头，将⽚段固定在flowcell上⽣成DNA簇，上机测序单端读取序列。该⽅式建库简单，操作步骤少，常⽤于⼩基因组、转录组、宏基因组测序。

双端测序：双端测序在DNA⽚段两端都加上接头，进⾏第⼀次测序，洗去模板链，将模块再原位置进⾏扩增，进⾏第⼆轮测序。

双端测序：

双端测序对⽐单端测序的优势

城乡信息一体化双端测序对⽐单端测序的优势：

该优势聚焦于测序中对测序长度的影响。Illumina测序的长度较短，单端测序对于不同位置重复出现的序列⽚段识别出相同的信息，这导致将该序列回帖⾄参考序列中时，导致⼀定的误差。⽽双端测序中，不同读段间的距离已知，即使对于重复出现的序列，双端测序也可推断出不同序列出现的位置，⼤⼤减少了序列回帖的误差。双端测序的序列信息往往可以得到较好的组装结果。

流水工艺品

另⼀个原因，所有的reads只能按照⼀个⽅向进⾏读取，这会导致测序的质量会随着读取长度的增加⽽下降。对于单端测序，其下游测序质量就会较低，⽽双端测序会从两个⽅向读取超过待测序列的⼀半。再根据两个序列重合部分进⾏拼接，读取序列的质量会由于单端测序的结果。在双端测序得到的fastQ⽂件read1和read2中，均具有相同的ID，并在ID后加/1 或/2 进⾏区分。

本文发布于:2024-09-21 10:41:37，感谢您对本站的认可！

本文链接：https://www.17tex.com/tex/2/285628.html

上一篇：RNA-seq(转录组学)的分析流程和原理

下一篇：转录组学技术的研究方法

标签：测序序列双端碱基长度读取

留言与评论（共有 0 条评论）