用于对生物聚合物进行测序的方法


用于对生物聚合物进行测序的方法
1.政府支持
2.本发明是在美国国立卫生研究院颁发的授权号r21 hg010522下在政府支持下完成的。政府拥有本发明的某些权利。
3.相关申请
4.本技术要求2020年2月28日提交的美国临时专利申请号62/983,417的优先权和权益,该申请以引用的方式整体并入本文用于所有目的。
5.以电子方式提交的材料的引用并入
6.与本文同时提交的计算机可读核苷酸/氨基酸序列表以引用的方式整体并入本文并且标识如下:一个ascii(文本)文件,名称为“2021-02-24_38882-601_sql_st25.txt”,大小为825字节,创建于2021年2月24日。
技术领域
7.本公开提供了与对生物聚合物进行测序相关的装置、系统和方法。具体而言,本公开提供了获得基于对应于感兴趣的酶的活性的电流波动的生物电子标志的方法。如本文所述,生物电子标志的某些方面可以用于确定生物聚合物的序列。


背景技术:



8.当蛋白质执行其各种功能时,产生作为这些功能的基础的运动。开发测量与活性蛋白质产生的波动相对应的电学特征的装置、系统和方法的能力可以作为蛋白质功能的无标签检测和分析的基础。例如,监测活性酶的功能波动可以提供一种快速而简单的筛选影响酶的功能的候选药物分子的方法。在其他情况下,监测处理生物聚合物(例如,碳水化合物、多肽、核酸等等)的蛋白质波动的能力可以揭示关于它们的构象变化以及这些变化如何与功能相关的新信息。另外,可以开发利用活性蛋白质产生的电学特征的诊断和分析装置,从而提供利用生物力学性质进行实际应用的新方式。


技术实现要素:



9.本公开的实施方案包括用于使用生物电子装置对多核苷酸进行测序的方法。根据这些实施方案,所述方法包括将模板多核苷酸引入所述生物电子装置中;将包含dntp单体的溶液引入包括模板多核苷酸的装置中,每种dntp以预先定义的浓度存在于所述溶液中;以及随着每个互补dntp单体掺入所述模板多核苷酸中,获得基于电流波动的聚合酶活性的生物电子标志。在一些实施方案中,所述生物电子标志的至少一个特征识别掺入所述模板多核苷酸中的互补dntp中的每个。在一些实施方案中,所述生物电子装置包括功能性地耦合到至少第一电极和第二电极的聚合酶。在一些实施方案中,所述生物电子装置包括功能性地耦合到第一电极和第二电极二者的聚合酶。
10.在一些实施方案中,所述生物电子标志包括对应于聚合酶处于开放状态的开放期。在一些实施方案中,每种dntp单体的开放期的持续时间是不同的,从而所述持续时间识
别特定的dntp单体是否已掺入所述模板多核苷酸中。
11.在一些实施方案中,所述溶液包含四种dntp单体。在一些实施方案中,第一dntp以一定浓度存在于所述溶液中,以使得其开放期的持续时间与第二dntp的开放期的持续时间最小重叠。在一些实施方案中,第二dntp以一定浓度存在于所述溶液中,以使得其开放期的持续时间与第一dntp和第三dntp的开放期的持续时间最小重叠。在一些实施方案中,第三dntp以一定浓度存在于所述溶液中,以使得其开放期的持续时间与第二dntp和第四dntp的开放期的持续时间最小重叠。在一些实施方案中,第四dntp以一定浓度存在于所述溶液中,以使得其开放期的持续时间与第三dntp的开放期的持续时间最小重叠。在一些实施方案中,所述多核苷酸模板的序列可以从每个开放期的持续时间准确地确定。在一些实施方案中,所述多核苷酸的序列可以从每个开放期的持续时间和/或闭合期的一个或多个特征准确地确定。
12.在一些实施方案中,每种dntp的开放期的持续时间基于多个开放持续期的分布来确定。在一些实施方案中,所述第一dntp以饱和浓度存在。在一些实施方案中,重叠程度为1%或更小。
13.在一些实施方案中,所述生物电子标志包括对应于聚合酶处于闭合状态的闭合期。在一些实施方案中,所述闭合期的至少一个特征基于此前掺入的核苷酸而变化。在一些实施方案中,所述闭合期的至少一个特征使用包括机器学习的方法来识别。在一些实施方案中,所述机器学习方法包括隐马尔可夫建模或贝叶斯非参数分析。
14.在一些实施方案中,所述闭合期的至少一种特征和所述开放期的至少一种特征的组合被用于识别掺入到所述模板多核苷酸中的所述互补dntp中的每个。
15.在一些实施方案中,所述多核苷酸模板是dna。在一些实施方案中,所述多核苷酸模板是rna。在一些实施方案中,所述dntp单体包括腺嘌呤(datp)、胞嘧啶(dctp)、鸟嘌呤(dgtp)、胸腺嘧啶(dttp)和/或尿苷(dutp),包括它们的任何衍生物或变体。
16.在一些实施方案中,所述聚合酶的核酸外切酶活性被失活。在一些实施方案中,所述聚合酶使用包括硫代链霉亲和素的接头功能性地耦合到所述第一电极和所述第二电极。在一些实施方案中,接头附接至所述聚合酶的非活性区域。
17.在一些实施方案中,所述方法包括在所述第一电极和所述第二电极之间施加100mv或更低的偏压。
18.本公开的实施方案还包括校准生物电子装置的方法。根据这些实施方案,所述方法包括将模板多核苷酸引入所述生物电子装置中;将包含dntp单体的溶液引入包括模板多核苷酸的装置中,每种dntp以饱和浓度存在于所述溶液中;随着每个互补dntp单体掺入所述模板多核苷酸中,获得基于电流波动的聚合酶活性的生物电子标志,其中所述生物电子标志包括对应于所述聚合酶处于开放状态的开放期;以及测量或确定每个dntp的所述开放期的内在分布。
19.在一些实施方案中,所述生物电子装置基于开放期的分布来校准。在一些实施方案中,所述生物电子装置包括功能性地耦合到至少第一电极和第二电极的聚合酶。在一些实施方案中,所述生物电子装置包括功能性地耦合到第一电极和第二电极二者的聚合酶。
20.在一些实施方案中,所述生物电子标志包括对应于所述聚合酶处于闭合状态的闭合期,并且所述生物电子装置基于所述闭合期的至少一个特性来校准。
附图说明
21.图1:根据本公开的一个实施方案,显示基于电流波动的酶活性的生物电子标志的代表性图。
22.图2:根据本公开的一个实施方案,图1的生物电子标志的扩展部分的代表性图,该图包括随着酶从开放状态(201)转变为闭合状态(202),新单体(例如,dntp)掺入生物聚合物的过程的时间部分。
23.图3:根据本公开的一个实施方案,感兴趣的酶(例如,聚合酶)处于开放状态或构象,等待单体(例如,dntp)到达的分布时间的代表性图。
24.图4:根据本公开的一个实施方案,感兴趣的酶(例如,聚合酶)处于开放状态或构象,等待单体(例如,dntp)到达的分布时间的代表性图,其中每个单体以预先定义的浓度存在于溶液中。
25.图5:图1的生物电子标志的扩展部分的代表性图,该图包括随着酶从开放状态(201)转变为闭合状态(202),新单体(例如,dntp)掺入生物聚合物的过程的时间部分;生物电子标志的某些特征(例如,闭合状态下的电流波动)可以使用隐马尔可夫建模和/或贝叶斯非参数建模来提取,这可以形成用于确定生物聚合物的序列的基础。
具体实施方式
26.本章节中使用的章节标题和本文的全部公开内容仅用于组织目的,并且不旨在进行限制。
27.1.定义
28.除非另有定义,否则本文使用的所有技术和科学术语与本领域的普通技术人员的通常理解具有相同的含义。如有冲突,以本文档(包括定义)为准。尽管与本文描述的那些方法和材料类似或等效的方法和材料可于本公开的实践或测试中,但在下文中描述了优选方法和材料。本文中提及的所有公布、专利申请、专利和其它参考文献通过引用以其整体并入。本文公开的材料、方法和示例仅仅是说明性的而不是旨在作为限制性的。
29.如本文所述,公开的实施方案仅出于说明性目的而不是限制性的。其他实施方案是可能的并且被本公开所覆盖,这将从本文所包含的教导中显而易见。因此,本公开的广度和范围不应受上述实施方案中的任一者的限制,而应仅根据本公开所支持的权利要求及其等同形式来定义。此外,本公开的实施方案可以包括方法、组合物、系统和设备/装置,其可以进一步包括来自任何其他公开的方法、组合物、系统和装置的任何和所有元件,包括对应于检测蛋白质活性的任何和所有元件。换句话说,来自一个或另一个公开的实施方案的元件可以与来自其他公开的实施方案的元件互换。此外,一些另外的实施方案可以通过将本文公开的一个和/或另一个特征与在以引用的方式并入的材料中公开的方法、组合物、系统和装置以及它们的一个或多个特征组合来实现。此外,公开的实施方案的一个或多个特征/元件可以被移除,并且仍然产生可授予专利的主题(并且因此产生本公开的另外更多的实施方案)。此外,与现有技术的教导相比,一些实施方案对应于特别地缺少一个和/或另一个元件、结构和/或步骤(如适用)的方法、组合物、系统和装置,因此表示可授予专利的主题并且可与现有技术教导区分开(即,针对此类实施方案的权利要求可以包含负面限制,以指出缺少现有技术教导的一个或多个特征部)。
30.如本文所定义和使用的所有定义应理解为支配字典定义、以引用的方式并入的文档中的定义和/或所定义术语的普通含义。
31.如本文在说明书和权利要求中所用的不定冠词“一个”和“一种”,除非明确指明相反,否则应理解为意指“至少一个/一种”。
32.如本文在说明书和权利要求中所用的短语“和/或”应理解为意指这样结合的元件中的“任一者或两者”,即,在一些情况下结合存在而在其他情况下分离存在的元件。用“和/或”列出的多个元件应以相同的方式解释,即“一个或多个”这样结合的元件。除了以“和/或”子句特别标识的元件之外,可以任选地存在其他元件,无论与那些特别标识的元件相关还是不相关。因此,作为非限制性示例,当与开放式语言诸如“包括”结合使用时,对“a和/或b”的引用在一个实施方案中可以仅指a(任选地包括除b之外的元件);在另一个实施方案中,仅指b(任选地包括除a之外的元件);在又一个实施方案中,指a和b二者(任选地包括其他元件);等等。
33.如本文在说明书和权利要求中所用的“或”应理解为与如上定义的“和/或”具有相同的含义。例如,当分隔列表中的项目时,“或”或者“和/或”应解释为具有包容性,即包括至少一个,但还包括多于一个的元件数量或列表,以及任选地其他未列出的项目。仅明确指出相反的术语,诸如“仅一个”或“恰好一个”,或当在权利要求中使用时,“由......组成”将指包括多个元件或元件列表中的恰好一个元件。一般而言,如本文所用的术语“或”,当前面带有排他性术语时,诸如“任一个”、“一个”、“仅一个”或“恰好一个”,仅应解释为表示排他性的替代项(即“一个或另一个但不是它们二者”)。权利要求中使用的“基本上由
……
组成”应具有在专利法领域中使用的普通含义。
34.如本文在说明书和权利要求中所用,在提及一个或多个元件的列表时,短语“至少一个”应理解为意指选自元件列表中的任何一个或多个元件的至少一个元件,但是不一定包括元件列表中特别列出的每个和每一个元件中的至少一个,并且不排除元件列表中的元件的任何组合。该定义还允许除在短语“至少一个”所指的元件列表中特别标识的元件之外的元件可以任选地存在,无论与那些特别标识的元件相关还是不相关。因此,作为非限制性示例,“a和b中的至少一个”(或等效地“a或b中的至少一个”,或等效地“a和/或b中的至少一个”),在一个实施方案中,可以指至少一个,任选地包括多于一个a,其中b不存在(并且任选地包括除b之外的元件);在另一个实施方案中,指至少一个,任选地包括多于一个b,其中a不存在(并且任选地包括除a之外的元件);在又一个实施方案中,指至少一个,任选地包括多于一个a,以及至少一个,任选地包括多于一个b(并且任选地包括其他元件);等等。
35.在权利要求以及上述说明书中,所有过渡短语诸如“包括”、“包含”、“携带”、“具有”、“含有”、“涉及”、“持有”、“由......组成”等等应理解为开放式的,即意味着包括但不限于。如美国专利局专利审查程序手册第2111.03节所述,过渡短语“由......组成”和“基本上由......组成”应仅分别为封闭式或半封闭式过渡短语。
36.2.生物电子装置和系统
37.本公开的实施方案包括与对生物聚合物进行测序相关的装置、系统和方法。具体而言,本公开提供了获得基于对应于感兴趣的酶的活性的电流波动的生物电子标志的方法。如本文所进一步描述,感兴趣的酶的生物电子标志(bioelectronic signature)的某些方面可以用于确定生物聚合物的序列。
38.根据这些实施方案,感兴趣的酶可以是聚合酶,并且当聚合酶将核苷酸单体添加到模板多核苷酸链时,聚合酶的生物电子标志的多个方面可以被用于确定该模板多核苷酸的序列。例如,聚合酶活性的生物电子标志可以基于随着每个互补核苷酸单体掺入模板多核苷酸中的电流波动;并且标志可以使用包括功能性耦合到至少第一电极和第二电极的聚合酶的生物电子装置来获得。在一些实施方案中,所述生物电子装置包括功能性地耦合到第一电极和第二电极二者的聚合酶。术语“核苷酸”通常是指碱基-糖-磷酸组合,并且包括核糖核苷三磷酸atp、utp、ctg、gtp和脱氧核糖核苷三磷酸诸如datp、dctp、ditp、dutp、dgtp、dttp或它们的衍生物。
39.在一些实施方案中,当聚合酶分子从开放状态(预备和准备好接受进入的dntp单体)和闭合状态(掺入进入的dntp并且在聚合酶内翻译新双螺旋)转变时,聚合酶分子的电导加倍。在该过程中获得的典型电信号的代表性图示显示于图1中。在非活性状态下,通过聚合酶的电流处于低基线水平(101)。一旦添加dntp,电流就会跳到与闭合状态(103)相关联的新的更高电导(102)。在掺入每个新核苷酸后,电流下降(104),这表明转变到下一个开放状态。在图1所示的迹线中,电流的向下扫描受到电子装置反应时间的限制。也就是说,较慢的开口确实会一直下降到电流的背景水平(101)。在这个特定的示例数据集中,聚合酶未捕获新模板(105),并且电流回落到基线水平(101)。
40.聚合酶活性的生物电子标志含有瞬时开放状态和期间的闭合区域二者的信息。例如,图2包括图1的生物电子标志的扩展部分的代表性图,该图包括随着酶从开放状态(201)转变为闭合状态(202),新单体(例如,dntp)掺入生物聚合物的过程的时间部分。图2中的两个瞬时开口(201)区分了切割三磷酸、掺入新核苷酸和翻译dna的反应时间,显示为τc(闭合区间,或202)。开放状态的宽度在箭头之间显示为τo。在第一开口(204)和后续的再开口之间的电流(203)含有反映在第一开口(204)中捕获的核苷酸的掺入的特征部或特征(203)。
41.如本文所进一步描述,活性聚合酶的生物电子标志的多个特征部或特性可以用于确定多核苷酸模板的序列。另外,如本领域的技术人员根据本公开将认识到,本文所述的获得生物电子标志和提取多个特征的方法可以用于确定任何生物聚合物和任何相应的感兴趣的酶的序列,所述生物聚合物和感兴趣的酶包括但不限于聚合酶、核酸酶、蛋白酶体、糖肽酶、糖苷酶、激酶和核酸内切酶。
42.如图3所进一步提供,互补dntp的选择出现在开放状态(201)期间,并且τo值的分布对dntp溶液的组成(例如,浓度)敏感。图3显示了在互补dntp(即,dttp)的1mm溶液中由10个a碱基组成的均聚物模板的给定τo值(301点)的测量概率。拟合分布曲线(302)是尖高斯曲线,峰值在0.16ms,宽度为0.3ms。
43.相比之下,当聚合酶必须寻互补dntp时,开放时间的分布要宽得多,如方块(303)所示。在这个示例中,模板包括在全部四种dntp的mm溶液中的五倍序列atc重复。现在分布通过指数来拟合(304),开放时间长达3ms(虽然所有值中的不到1%超过约2ms,如方框305所示)。
44.这些时间反映了聚合酶的内在反应,这可以通过考虑在这些mm浓度下进入的dntp之间的时间来看出。
45.对于分子扩散常数d和浓度[c]颗粒/m3,分子进入半径为r
p
(即聚合酶的半径,约3nm)的s球体的通量i为
[0046]
i=4πr
p
d[c]
[0047]
dntp的扩散常数由爱因斯坦-斯莫卢霍夫斯基(einstein-smoluchowski)关系和斯托克(stoke)定律给出
[0048][0049]
此处,rn是dntp的半径,η是水的粘度(10-3
pa.s,在300k下)。
[0050]
因此
[0051][0052]
其中i是每秒进入聚合酶的颗粒数,[c]体积中的浓度的单位是颗粒/m3。这可以表示为体积摩尔浓度(m)乘以1000
×
na(na是阿伏伽德罗数),从而得出
[0053][0054]
在300k下,kt=4.14
×
10-21
j,并且η对于水为10-3
pa.s,所以
[0055][0056]
在r
p
/rn为约3的情况下,这在1mm dntp下给出约5
×
106的通量(或到达之间的时间为约0.2μs)。因此,dntp以超过100个/最快开口事件的速率到达聚合酶。因此,图3所示的t时间表示聚合酶的内在反应时间。在正确的dntp始终存在的情况下(301),这始终为约0.16ms。当聚合酶必须保持开放状态才能在四种可能的dntp中到正确的互补核苷酸时,时间分布要宽得多(303)。在mm浓度的dntp下,几乎所有搜索事件都在约3ms结束。
[0057]
关系式1可以用于预测dntp在降低浓度下的到达速率。重要的是,这个到达速率将根据泊松(poisson)分布来进行分布:
[0058][0059]
它有以下特殊性质,即到达之间的平均间隔μ也是分布的方差。
[0060]
图4显示了聚合酶在mm dntp处的开放时间的内在分布,它以指数方式接近原点(401)。相邻分布(402)使用关系式2来计算,其中μ=17ms。关系式1给出
[0061][0062]
如该示例性数据所示,17ms间隔对应于i=58.8或11nm溶液,以给出由(402)所示的到达时间分布。在这种情况下,到达之间的间隔比聚合酶的内在反应要长得多,因此这决定了开放状态的寿命。因此,如果第一dntp以mm浓度存在,而第二dntp以11nm存在,则开放时间分布的重叠将由曲线401和402之间的重叠给出(这些曲线均为归一化的,因此总概率=1)。该重叠(405)为约0.001或约百分数的十分之一。第三dntp进一步稀释至3.8nm将产生μ=50ms,这给出标记为403的曲线。第四dntp稀释至1.9nm给出μ=100ms,所得分布被绘制为标记为404的曲线。对于以曲线403表示的dntp,与曲线402的重叠为0.004(406),与曲线404的重叠也为0.004(407)。因此,在开口事件后掺入的核苷酸可以通过开口事件的持续时间优于1%来识别。
[0063]
在一些实施方案中,第一dntp可以以在约1mm至约10mm、约1mm至约8mm、约1mm至约6mm、约1mm至约5mm、约1mm至约4mm、约1mm至约3mm、或约1mm至约2mm范围内的浓度存在于溶液中。在一些实施方案中,第一dntp可以以在约2mm至约10mm、约4mm至约10mm、约5mm至约10mm、约6mm至约10mm、约7mm至约10mm、约8mm至约10mm、或约8mm至约10mm范围内的浓度存在于溶液中。在一些实施方案中,第一dntp可以以约1mm、2mm、3mm、4mm、5mm、6mm、7mm、8mm、9mm、或10mm的浓度存在于溶液中。因此,在一些实施方案中,第二dntp可以以在约5nm至约15nm、约10nm至约15nm、约12nm至约15nm、约5nm至约12nm、约5nm至约10nm、约5nm至约8nm、约7nm至约12nm、或约8nm至约10nm范围内的浓度存在于溶液中。在一些实施方案中,第二dntp可以以约5nm、6nm、7nm、8nm、9nm、10nm、11nm、12nm、13nm、14nm、或15nm的浓度存在于溶液中。因此,在一些实施方案中,第三dntp可以以在约1nm至约10nm、约1nm至约8nm、约1nm至约6nm、约1nm约5nm、约2nm至约10nm、约3nm至约10nm、约2nm至约8nm、或约2nm至约6nm范围内的浓度存在于溶液中。在一些实施方案中,第三dntp可以以约1nm、2nm、3nm、4nm、5nm、6nm、7nm、8nm、9nm、或10nm的浓度存在于溶液中。因此,在一些实施方案中,第四dntp可以以在约0.1nm至约5nm、约0.1nm至约2.5nm、约0.1nm至约1nm、约0.5nm至约5nm、约0.5nm至约2.5nm、约1nm至约5nm、约1nm至约4nm、或约1nm至约2.5nm范围内的浓度存在于溶液中。在一些实施方案中,第四dntp可以以约1.5nm、1.6nm、1.7nm、1.8nm、1.9nm、2nm、2.1nm、2.2nm、2.3nm、2.4nm、或2.5nm的浓度存在于溶液中。如本领域的普通技术人员根据本公开将认识,这些dntp浓度不意味着进行限制,并且可以根据本文所述的方法的多个方面(例如,模板序列和结构)进行调整。
[0064]
如表1和2(下文)所示,开放和闭合时间的分布随序列和模板结构而变化。这些数据显示了以下序列的测量时间分布:(1)aaaaaaaaaa(seq id no:1)-单链寡聚体(a10),dttp仅在聚合缓冲液中;(2)atcatcatcatcatc(seq id no:2)-单链寡聚体(atc5),存在全部4种dntp;(3)catctactacgcttagcttgctatcatctatgcttagcatga(seq id no:3)-环状模板,存在全部4种dntp。
[0065]
表1:三个模板序列的开放状态时间。
[0066]
序列开放状态1分裂状态1开放状态2分裂状态2a100.26ms1.00
ꢀꢀ
atc50.22ms0.761.47ms0.2442个nt环0.12ms0.850.78ms0.15
[0067]
表2:三个模板序列的闭合状态时间。
[0068]
序列闭合状态1分裂状态1闭合状态2分裂状态2a100.37ms1.00
ꢀꢀ
atc50.35ms0.712.7ms0.2942个nt环0.12ms0.561.96ms0.44
[0069]
均聚物a10的特征在于只有一个开放状态和一个闭合状态。杂聚物atc5的特征在于2个开放时间,一个与a10一样快,为事件的约3/4,而1/4则慢得多(表1)。同样,其大部分(约3/4)闭合状态的持续时间与均聚物一样短,其余1/4则慢得多(表2)。具有杂聚物序列的环状模板在其开放和闭合状态下也表现出两种状态,但是这两个事件都比线性聚合物中的事件更快。
[0070]
总之,这些数据表明,开放时间对缓冲液的核苷酸组成敏感。对于仅存在dttp的a10,只有一个(快速)开放时间。当全部四种核苷酸都存在时,有两种开放状态。较短的开放状态可能对应于第一次尝试捕获正确的核苷酸,而较长的开放时间则可能对应于捕获,然后排斥非互补核苷酸。数据还显示了闭合时间(对应于环的催化部分)如何也取决于序列。对于均聚物a10,只有一个快速闭合时间。杂聚物都有两个不同的闭合时间,一个快,第二个几乎长十倍,这说明了一些核苷酸掺入需要更长的时间。
[0071]
参考图5中表示的数据,将给定的闭合事件(202)与特定核苷酸的掺入相关联的能力允许进一步识别与特定核苷酸相关的信号特征部或特征。此外,在此前掺入的特定核苷酸之上掺入特定核苷酸还允许进一步识别与特定核苷酸相关的信号特征部或特征,以使得闭合间隔中的信号特征反映16种此类组合(“碱基堆叠”)。虽然开放状态表示电流相对于闭合状态的较大变化,但是闭合状态下的电流变化是随机的并且受噪声的影响。然而,基础水平可以使用例如无限隐马尔可夫模型和贝叶斯非参数方法以不依赖于模型的方式提取。结果,特征水平可以以无模型方式定位,如图5中的“隐”基础状态(501)所示。
[0072]
根据本文所述的实施方案,本公开提供了用于使用生物电子装置对多核苷酸进行测序的方法。在一些实施方案中,所述方法包括将模板多核苷酸引入所述生物电子装置中,以及将包含dntp单体的溶液引入包括模板多核苷酸的装置中。在一些实施方案中,每种dntp以预先定义的浓度存在于溶液中。在一些实施方案中,所述方法包括随着每个互补dntp单体掺入所述模板多核苷酸中,获得基于电流波动的聚合酶活性的生物电子标志。在一些实施方案中,所述生物电子标志的至少一个特征识别掺入所述模板多核苷酸中的互补dntp中的每个。在一些实施方案中,所述生物电子装置包括功能性地耦合到至少第一电极和第二电极的聚合酶。在一些实施方案中,所述生物电子装置包括功能性地耦合到第一电极和第二电极二者的聚合酶。
[0073]
在一些实施方案中,所述生物电子标志包括对应于聚合酶处于开放状态的开放期。在一些实施方案中,每种dntp单体的开放期的持续时间是不同的,从而所述持续时间识别特定的dntp单体是否已掺入所述模板多核苷酸中。在一些实施方案中,所述溶液包含四种dntp单体。在一些实施方案中,第一dntp以一定浓度存在于所述溶液中,以使得其开放期的持续时间与第二dntp的开放期的持续时间最小重叠。在一些实施方案中,第二dntp以一定浓度存在于所述溶液中,以使得其开放期的持续时间与第一dntp和第三dntp的开放期的持续时间最小重叠。在一些实施方案中,第三dntp以一定浓度存在于所述溶液中,以使得其开放期的持续时间与第二dntp和第四dntp的开放期的持续时间最小重叠。在一些实施方案中,第四dntp以一定浓度存在于所述溶液中,以使得其开放期的持续时间与第三dntp的开放期的持续时间最小重叠。根据这些实施方案,所述多核苷酸模板的序列可以从每个开放期的持续时间准确地确定。在一些实施方案中,所述多核苷酸的序列可以从每个开放期的持续时间和/或闭合期的一个或多个特征准确地确定。
[0074]
在一些实施方案中,每种dntp的开放期的持续时间基于多个开放持续期的分布来确定。在一些实施方案中,所述第一dntp以饱和浓度存在。在一些实施方案中,重叠程度为1%或更小。在一些实施方案中,分布的最小重叠程度为1%或更小。在一些实施方案中,分布的最小重叠程度为0.9%或更小。在一些实施方案中,分布的最小重叠程度为0.8%或更小。在一些实施方案中,分布的最小重叠程度为0.7%或更小。在一些实施方案中,分布的最
小重叠程度为0.6%或更小。在一些实施方案中,分布的最小重叠程度为0.5%或更小。在一些实施方案中,分布的最小重叠程度为0.4%或更小。在一些实施方案中,分布的最小重叠程度为0.3%或更小。在一些实施方案中,分布的最小重叠程度为0.2%或更小。在一些实施方案中,分布的最小重叠程度为0.1%或更小。在一些实施方案中,分布的最小重叠程度为0.075%或更小。在一些实施方案中,分布的最小重叠程度为0.050%或更小。在一些实施方案中,分布的最小重叠程度为0.025%或更小。在一些实施方案中,分布的最小重叠程度为0.010%或更小。在一些实施方案中,分布的最小重叠程度为0.005%或更小。在一些实施方案中,分布的最小重叠程度为0.001%或更小。在一些实施方案中,分布的最小重叠程度为0.0001%或更小。
[0075]
在一些实施方案中,所述生物电子标志包括对应于聚合酶处于闭合状态的闭合期。在一些实施方案中,所述闭合期的至少一个特征基于此前掺入的核苷酸而变化。在一些实施方案中,所述闭合期的至少一个特征使用包括机器学习的方法来识别。在一些实施方案中,所述机器学习方法包括隐马尔可夫建模或贝叶斯非参数分析。在一些实施方案中,所述闭合期的至少一种特征和所述开放期的至少一种特征的组合被用于识别掺入到所述模板多核苷酸中的所述互补dntp中的每个。在一些实施方案中,所述多核苷酸模板是dna。在一些实施方案中,所述多核苷酸模板是rna。在一些实施方案中,所述dntp单体包括腺嘌呤(datp)、胞嘧啶(dctp)、鸟嘌呤(dgtp)、胸腺嘧啶(dttp)和/或尿苷(dutp),包括它们的任何衍生物或变体。
[0076]
正如本领域的普通技术人员在受益于本公开的教导后将容易地认识和理解,本文所述的方法可以与感测酶(例如,聚合酶)的开放和闭合状态的持续时间的任何生物电子装置一起使用。示例性装置包括但不限于美国专利号10,422,787和pct申请号pct/us2019/032707中公开的生物电子装置和系统,这二个专利均以引用的方式整体并入本文用于所有目的。另外,本领域的普通技术人员基于本公开将容易地认识和理解,前述实施方案同样适用于(并且包括)用rntp替代dntp和使用rna聚合酶对rna进行测序。
[0077]
根据这些实施方案,所述聚合酶可以使用包括硫代链霉亲和素的接头功能性地耦合到所述第一电极和所述第二电极。在一些实施方案中,所述聚合酶是生物素化的。在一些实施方案中,所述接头附接至所述聚合酶的非活性区域。在一些实施方案中,所述聚合酶以及所述第一电极和所述第二电极是生物素化的,并且所述接头包括链霉亲和素分子,所述链霉亲和素分子包含至少两个生物素结合位点。在一些实施方案中,所述聚合酶的核酸外切酶活性被失活。在一些实施方案中,所述间隙具有约1.0nm至约20.0nm的宽度。在一些实施方案中,所述第一电极和所述第二电极由介电层间隔开。在一些实施方案中,所述方法包括在所述第一电极和所述第二电极之间施加100mv或更低的偏压。
[0078]
本公开的实施方案还包括一种用于聚合酶活性的直接电测量的系统。根据这些实施方案,所述系统包括以下中的任一者:本文所述的生物电子装置、用于引入能够与所述聚合酶相互作用的dntp的装置、用于在所述第一电极和所述第二电极之间施加100mv或更低的偏压的工具以及用于监测当dntp通过所述聚合酶掺入模板多核苷酸时发生的波动的装置。
[0079]
本公开的实施方案还包括校准生物电子装置的方法。根据这些实施方案,所述方法包括将模板多核苷酸引入所述生物电子装置中;将包含dntp单体的溶液引入包括模板多
核苷酸的装置中,每种dntp以饱和浓度存在于所述溶液中;随着每个互补dntp单体掺入所述模板多核苷酸中,获得基于电流波动的聚合酶活性的生物电子标志,其中所述生物电子标志包括对应于所述聚合酶处于开放状态的开放期;以及测量或确定每个dntp的所述开放期的内在分布。
[0080]
在一些实施方案中,所述生物电子装置基于开放期的分布来校准。在一些实施方案中,所述生物电子装置包括功能性地耦合到至少第一电极和第二电极的聚合酶。在一些实施方案中,所述生物电子装置包括功能性地耦合到第一电极和第二电极二者的聚合酶。在一些实施方案中,所述生物电子标志包括对应于所述聚合酶处于闭合状态的闭合期,并且所述生物电子装置基于所述闭合期的至少一个特性来校准。
[0081]
本公开的实施方案还包括在来自跨越结的聚合酶蛋白的电信号中调用碱基的方法。这些方法包括测量在饱和浓度的dntp中发挥功能的聚合酶的开放时间的内在分布;在至少一种dntp被稀释的溶液中重复所述测量,从而可以通过相应的开放状态时间的增加来识别所述dntp的掺入;根据被掺入的核苷酸和此前掺入的核苷酸来表征开放状态和随后的闭合状态二者的信号特征,其中所述核苷酸首先使用本文所述的稀释方法来识别;以及优化每个核苷酸的稀释和信号参数的使用,从而以最快的读取速率获得所期望的测序准确性。
[0082]
在一些实施方案中,本文提供的方法包括通过将包含dna模板的第一溶液引入装置中来测量或确定聚合酶的开放状态,其中所述装置包括由间隙间隔开的第一电极和第二电极,以及附接至所述第一电极和所述第二电极的聚合酶;在允许掺入与dna模板互补的dntp的条件下,将包含四种dntp的第二溶液引入上一步的步骤产物中,其中所述dntp以饱和浓度存在于所述溶液中;以及测量所述聚合酶的开放时间的内在分布。
[0083]
在一些实施方案中,本公开的方法包括校准测序装置,所述测序装置包括由间隙间隔开的第一电极和第二电极,以及附接至所述第一电极和所述第二电极的聚合酶。根据这些实施方案,所述方法包括将包含dna模板的第一溶液引入装置中,其中所述装置包括由间隙间隔开的第一电极和第二电极,以及附接至所述第一电极和所述第二电极的聚合酶;在允许掺入与dna模板互补的dntp的条件下,将包含四种dntp的第二溶液引入上一步的产物中,其中所述dntp以饱和浓度存在于所述溶液中;以及测量所述聚合酶的开放时间的内在分布,其中所述测序装置基于测量的开放时间的内在分布来校准。
[0084]
在一些实施方案中,本公开的方法包括识别掺入dna链中的碱基。根据这些实施方案,所述方法包括将包含dna模板的第一溶液引入装置中,其中所述装置包括由间隙间隔开的第一电极和第二电极,以及附接至所述第一电极和所述第二电极的聚合酶,并且其中所述装置已经根据上文所述的方法进行了校准;在允许掺入与dna模板互补的dntp的条件下,将包含四种dntp的第二溶液引入上一步的产物中,其中第一dntp以一定浓度存在于所述溶液中,以使得其到达时间的分布与饱和浓度的第二dntp的聚合酶打放时间的分布最小重叠,第二dntp以一定浓度存在于所述溶液中,以使得其到达时间的分布与所述第一dntp的到达时间的分布最小重叠,第三dntp以一定浓度存在于所述溶液中,以使得其到达时间的分布与所述第二dntp的到达时间的分布最小重叠,以及第四dntp以一定浓度存在于所述溶液中,以使得其到达时间的分布与所述第三dntp的到达时间的分布最小重叠;以及测量随时间推移的电流;其中碱基从(或根据)一组给定的核苷酸浓度的聚合酶的已知分布开放时
间来识别。
[0085]
在一些实施方案中,本公开的方法包括对dna进行测序。根据这些实施方案,所述方法包括将包含dna模板的第一溶液引入装置中,其中所述装置包括由间隙间隔开的第一电极和第二电极,以及附接至所述第一电极和所述第二电极的聚合酶,并且其中所述装置已经根据上文所述的方法进行了校准;在允许掺入与dna模板互补的dntp的条件下,将包含四种dntp的第二溶液引入上一步的产物中,其中第一dntp以饱和浓度存在于所述溶液中,第二dntp以一定浓度存在于所述溶液中,以使得其到达时间的分布与所述第一dntp的到达时间的分布最小重叠,第三dntp以一定浓度存在于所述溶液中,以使得其到达时间的分布与所述第二dntp的到达时间的分布最小重叠,以及第四dntp以一定浓度存在于所述溶液中,以使得其到达时间的分布与所述第三dntp的到达时间的分布最小重叠;以及测量随时间推移的电流;其中所述dna从(或根据)给定浓度的第一dntp、第二dntp、第三dntp和第四dntp的聚合酶的已知分布开放时间来测序。
[0086]
在一些实施方案中,本公开的方法包括提高生物聚合物测序系统和方法(例如,dna测序、rna测序或其他生物聚合物测序)的准确性。根据这些实施方案,所述方法包括根据上文所述的方法收集随时间推移的电流记录,以及在开放状态信号之间收集来自闭合状态的电流信号部分,以及根据在给定开放事件中掺入的核苷酸对它们进行分选,以及在先前事件中掺入的核苷酸产生多组(例如,16组)闭合状态信号,它们中的每个与两个连续掺入事件中的给定核苷酸对的掺入相关。在一些实施方案中,所述方法包括应用一种或多种机器学习方法来定位闭合状态电流中与两个连续掺入事件中的给定核苷酸对相关的信号特征。在一些实施方案中,机器学习方法可以包括例如隐马尔可夫建模或贝叶斯非参数分析。

技术特征:


1.一种用于使用生物电子装置对多核苷酸进行测序的方法,所述方法包括:(a)将模板多核苷酸引入所述生物电子装置中,其中所述生物电子装置包括功能性地耦合到第一电极和第二电极中的至少一者的聚合酶;(b)将包含dntp单体的溶液引入包括所述模板多核苷酸的所述装置中,每种dntp以预先定义的浓度存在于所述溶液中;以及(c)随着每个互补dntp单体掺入所述模板多核苷酸中,获得基于电流波动的聚合酶活性的生物电子标志;其中所述生物电子标志的至少一个特征识别掺入所述模板多核苷酸中的互补dntp中的每个。2.如权利要求1所述的方法,其中所述生物电子标志包括对应于所述聚合酶处于开放状态的开放期。3.如权利要求1或权利要求2所述的方法,其中每种dntp单体的开放期的持续时间是不同的,从而所述持续时间识别特定的dntp单体是否已掺入所述模板多核苷酸中。4.如权利要求1至3中任一项所述的方法,其中所述溶液包含四种dntp单体,并且其中第一dntp以一定浓度存在于所述溶液中,以使得其开放期的持续时间与第二dntp的开放期的持续时间最小重叠;其中所述第二dntp以一定浓度存在于所述溶液中,以使得其开放期的持续时间与所述第一dntp和第三dntp的开放期的持续时间最小重叠;其中所述第三dntp以一定浓度存在于所述溶液中,以使得其开放期的持续时间与所述第二dntp和第四dntp的开放期的持续时间最小重叠;并且其中所述第四dntp以一定浓度存在于所述溶液中,以使得其开放期的持续时间与所述第三dntp的开放期的持续时间最小重叠。5.如权利要求1至4中任一项所述的方法,其中每种dntp的开放期的持续时间基于多个开放持续期的分布来确定。6.如权利要求1至5中任一项所述的方法,其中所述第一dntp以饱和浓度存在。7.如权利要求4至6中任一项所述的方法,其中重叠程度为1%或更小。8.如权利要求1所述的方法,其中所述生物电子标志包括对应于所述聚合酶处于闭合状态的闭合期。9.如权利要求8所述的方法,其中所述闭合期的至少一个特征基于此前掺入的核苷酸而变化。10.如权利要求8或权利要求9所述的方法,其中所述闭合期的至少一个特征使用包括机器学习的方法来识别。11.如权利要求10所述的方法,其中所述机器学习方法包括隐马尔可夫建模或贝叶斯非参数分析。12.如权利要求1至11中任一项所述的方法,其中所述闭合期的至少一种特征和所述开放期的至少一种特征的组合被用于识别掺入到所述模板多核苷酸中的所述互补dntp中的每个。13.如权利要求1至12中任一项所述的方法,其中所述多核苷酸模板是dna。14.如权利要求1至13中任一项所述的方法,其中所述聚合酶的核酸外切酶活性被失活。15.如权利要求1至14中任一项所述的方法,其中所述聚合酶使用包括硫代链霉亲和素
的接头功能性地耦合到所述第一电极和所述第二电极。16.如权利要求15所述的方法,其中所述接头附接至所述聚合酶的非活性区域。17.如权利要求1至16中任一项所述的方法,其中所述方法包括在所述第一电极和所述第二电极之间施加100mv或更低的偏压。18.如权利要求1至17中任一项所述的方法,其中所述dntp单体包括腺嘌呤(datp)、胞嘧啶(dctp)、鸟嘌呤(dgtp)和胸腺嘧啶(dttp)。19.一种校准生物电子装置的方法,所述方法包括:(a)将模板多核苷酸引入所述生物电子装置中,其中所述生物电子装置包括功能性地耦合到至少第一电极和第二电极的聚合酶;(b)将包含dntp单体的溶液引入包括所述模板多核苷酸的所述装置中,每种dntp以饱和浓度存在于所述溶液中;(c)随着每个互补dntp单体掺入所述模板多核苷酸中,获得基于电流波动的聚合酶活性的生物电子标志,其中所述生物电子标志包括对应于所述聚合酶处于开放状态的开放期;以及(d)测量或确定每个dntp的开放期的内在分布,其中所述生物电子装置基于开放期的分布来校准。20.如权利要求19所述的方法,其中所述生物电子标志包括对应于所述聚合酶处于闭合状态的闭合期,并且其中所述生物电子装置基于所述闭合期的至少一个特性来校准。

技术总结


本公开提供了与对生物聚合物进行测序相关的装置、系统和方法。具体而言,本公开提供了获得基于对应于感兴趣的酶的活性的电流波动的生物电子标志的方法。如本文所述,生物电子标志的某些方面可以用于确定生物聚合物的序列。列。列。


技术研发人员:

S.林德赛

受保护的技术使用者:

代表亚利桑那大学的亚利桑那校董事会

技术研发日:

2021.02.24

技术公布日:

2022/11/22

本文发布于:2024-09-22 15:40:01,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/21812.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:所述   实施方案   多核   电极
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议