多模块生物合成酶基因组合文库的制备方法与流程



1.本发明涉及一种制备包含编码多模块生物合成酶的多个基因在内的基因簇构建体的方法、以及由该基因簇构建体制备多模块生物合成酶基因组合文库的方法。


背景技术:



2.已知由放线菌或丝状菌等微生物产生的天然化合物是具有多种多样的结构和生物活性的有用物质。目前,通过解读基因组,可以很容易地确定用于生物合成有用物质的基因簇。此外,还明确了存在大量用于生物合成人类未利用的有用物质的基因簇。在微生物的次级代谢产物中,重点研究了用于对具有产业重要性的聚酮类化合物和肽类化合物进行生物合成的基因簇。例如,可以列举出i型聚酮合酶(polyketidesynthase;pks),其用于在放线菌产生的次级代谢产物中临床应用的erythromycin、fk-506(tacrolimus)、rapamycin及avermectin等大环内酯类化合物的生物合成。
3.考虑到通过传统的化学方法生产聚酮化合物等的难度、以及野生型细胞中的聚酮通常的低生产性,寻用于生产聚酮化合物的改良或替代方法成为备受瞩目的焦点。由于这些原因,通过将生物合成所需的基因簇从原始菌株引入到其他细胞中来尝试化合物的异源生产。实际上,异源表达的传统方法大多限定于小的基因簇(<40kb),而很多pks基因簇都比它大得多,其为从数千碱基到100千碱基以上的dna。
4.作为组装dna的方法,已知有金门(golden gate)法、吉布森(gibson)法等连接多个dna片段的方法(非专利文献1)。
5.golden gate法是准备一个或两个末端包含由iis型限制性核酸内切酶识别的碱基序列的多个dna片段,并用iis型限制性核酸内切酶和dna连接酶进行处理的方法。可以通过由iis型限制性核酸内切酶切割产生的粘性末端(sticky end),来使多个dna片段杂交,接着利用dna连接酶连接缺口,来制造出具有所需碱基序列的dna片段。通过设计由iis型限制性核酸内切酶识别的碱基序列的类型和排列,可以将由iis型限制性核酸内切酶切割的多个dna片段连接起来以使限制性核酸内切酶的识别位点消除,从而制造出具有所需碱基序列的dna片段。报告了一种通过利用golden gate法来将具有所需碱基序列的dna片段导入克隆载体的方法等(专利文献1和非专利文献1)。
6.gibson法是准备以相邻连接的dna片段的各自末端部的连接区域重叠15~80个碱基对(bp)左右的方式(以成为相同碱基序列的方式)进行设计的多个dna片段,用5'核酸外切酶、dna聚合酶和dna连接酶进行处理的方法。通过5'核酸外切酶从dna片段末端部分地产生单链dna。所产生的单链dna在重复的碱基序列部分中杂交。然后,通过dna聚合酶填充间隙,并通过dna连接酶来连接缺口,从而可以制造出具有所需碱基序列的dna片段。
7.在gibson法中,由于不需要包含由限制性核酸内切酶识别的碱基序列等,因此没有碱基序列的限制,并且也适用于长dna片段的构建(非专利文献2、专利文献2以及专利文献3)。
8.现有技术文献
9.专利文献
10.专利文献1:美国专利申请公开第2010/0291633号说明书
11.专利文献2:美国专利第7723077号说明书
12.专利文献3:日本特表2011-512140号公报
13.非专利文献
14.非专利文献1:plos one,2009年,4(5),e5553
15.非专利文献2:化学和生物,2016年,vol.54,no.10,pp.740~746


技术实现要素:



16.发明所要解决的课题
17.即使通过混合pks模块生产出新物质,多数情况下产量也会大大减少,并且目前尚未建立有效的改变方法。原因很复杂,可以想到的说明之一是,构建大部分的聚酮骨架的是伸长基质,难以人为地改变伸长反应,据推测由上游模块提供的酮类无法扩展。
18.可以想到的另一个说明是,在异源生产时,任一宿主的转录控制系统都与放线菌或丝状菌不同,因此为了得到充分的表达量,需要置换生物合成所需的全部基因的启动子。例如,通过添加或置换已知在异种宿主中发挥功能的强启动子,可以提高在异种宿主中的聚酮的生产率(非专利文献2、非专利文献3)。然而,次级代谢产物的生物合成反应大多涉及多个阶段,因此需要使多个基因共表达。此时,如果尽可能地使各基因高表达,则不能达到最佳的生产水平(非专利文献4),并且需要协调的表达。考虑到预测基因表达的理想平衡的难度,在异种宿主中制备生产率高的生物合成基因簇的最有效的方法在于制备具备对与合成调节相关的转录和翻译进行控制的各种启动子强度和核糖体结合位点(rbs)的基因簇库。可以认为,通过在广义范围的转录水平和翻译水平两者中控制单个酶的相对量,可以发现与蛋白质表达的理想平衡相关的组合。
19.因此,为了同时研究多个pks模块的组合和表达参数,从效率性的观点出发,优选组合文库技术,该组合文库技术对于各模块和/或表达参数,从存在多个选择项中选择一个,将它们分别连接以构建多种pks基因簇。
20.用于解决问题的方法
21.本发明提供了以下发明〔1〕至〔11〕。
22.〔1〕一种方法,具体是一种制备包含编码多模块生物合成酶的多个基因在内的基因簇构建体的方法,
23.其包括以下工序:
24.(a)制备可重构所述基因簇构建体并具有可交替连接结构的多个dna片段的工序;
25.(b)通过将工序(a)中制备的多个dna片段在溶液中混合来交替连接多个dna片段,从而得到基因簇构建体的工序。
26.〔2〕根据〔1〕所述的方法,其中,所述dna片段各自包含在质粒中,并且还包括由所述质粒制备所述工序(a)的dna片段的工序。
27.〔3〕一种方法,具体是一种制备包含编码多模块生物合成酶的多个基因在内的基因簇构建体的方法,
28.其包括以下工序:
29.(p)制备包含具有可交替连接的结构的多个dna片段在内的多种质粒的工序;
30.(a1)分别用适合的限制性核酸内切酶处理多种所述质粒,并制备多种dna片段的混合液的工序;
31.以及(b1)使用在工序(a1)中得到的dna片段的混合液,使dna片段再聚集以得到所述基因簇构建体的工序。
32.〔4〕根据〔3〕所述的方法,其中,在所述工序(p)中,制备包含多个dna片段的多种质粒,该dna片段具有能够通过使用枯草芽孢杆菌来交替连接的结构。
33.〔5〕根据〔1〕至〔4〕中任一项所述的方法,其中,所述多模块生物合成酶是模块化聚酮合酶(pks)。
34.〔6〕根据〔3〕所述的方法,其中,所述限制性核酸内切酶是typeii限制性核酸内切酶。
35.〔7〕一种制备质粒组合文库的方法,其中,将通过〔1〕至〔6〕中任一项所述的方法制备的所述基因簇构建体转化为枯草芽孢杆菌,并从枯草芽孢杆菌中回收质粒dna。
36.〔8〕根据〔3〕所述的方法,其中,选择多种通过〔7〕所述的制备方法来得到的质粒,将其作为所述工序(a1)中的质粒进行再利用,并实施所述工序(a1)和所述工序(b1)。
37.〔9〕一种通过〔7〕所述的制备方法来得到的质粒组合文库。
38.〔10〕一种通过将〔9〕所述的质粒转化到宿主细胞中来制备多模块生物合成酶的方法。
39.〔11〕根据〔10〕所述的方法,其中,所述宿主细胞是streptomyces属的微生物。
40.发明效果
41.根据本发明,可以由通过一锅反应而合成的基因簇构建体构建多模块生物合成酶的组合文库,例如pks基因簇文库整体。由此,可以期待用于优化基因簇表达产量和提高生理活性的化学多样性的生成。
附图说明
42.图1是示意性地示出实施例1和2的顺序的图。
43.图2是示出实施例1和2中得到的质粒的限制性消化模式的一例的图片。
44.图3是ogab载体1.0的载体图。
45.图4是ogab载体2.0的载体图。
46.图5是ogab载体2.1的载体图。
47.图6是ogab载体2.2的载体图。
具体实施方式
48.以下,对本发明具体实施方式详细进行说明。但是,本发明并不限于以下实施方式。
49.一种制备包含编码一实施方式所涉及的多模块生物合成酶的多个基因在内的基因簇构建体的方法,其包括以下工序:(a)制备可重构基因簇构建体并具有可交替连接结构的多个dna片段的工序;以及(b)通过将工序(a)中制备的多个dna片段在溶液中混合来交替连接多个dna片段,从而得到基因簇构建体的工序。
50.根据另一实施方式所涉及的制备包含编码多模块生物合成酶的多个基因在内的基因簇构建体的方法包括以下工序:(p)制备包含具有可交替连接的结构的多个dna片段在内的多种质粒的工序,(a1)通过将多种所述质粒分别用适合的限制性核酸内切酶进行处理,来制备多种dna片段的混合液的工序;以及(b1)使用在工序(a1)中得到的dna片段的混合液,使dna片段再聚集,以得到所述基因簇构建体的工序。
51.在本说明书中,作为多模块生物合成酶,可以列举出i型聚酮合酶(有时仅记载为“pks”或“i型pks”。)和非核糖体肽合成酶。
52.通过将本发明中得到的基因簇构建体或质粒与特定宿主相组合,可以高效地产生由多模块生物合成酶生物合成的有用物质(例如,聚酮或非核糖体肽)。在一个优选的实施方式中,本发明可以利用编码天然产生的多模块生物合成酶的基因(例如,i型pks基因或非核糖体肽合成酶)实质上缺失的、且进行了基因操作的宿主细胞。这些宿主细胞可以用包含编码各种多模块生物合成酶的基因(例如,i型pks基因或非核糖体肽合成酶基因)在内的质粒进行转化,以产生由多模块生物合成酶生物合成的有用物质(例如,活性聚酮或非核糖体肽)。本发明提供在生长周期的适当阶段大量产生的产物。由这样产生的多模块生物合成酶生物合成的有用物质(例如,聚酮或非核糖体肽)取决于由多模块生物合成酶生物合成的有用物质(例如,聚酮或非核糖体肽)的类型,并且可以作为剂用于多种疾病。例如,已发现由本发明的质粒转化而成的宿主所产生的一些聚酮或或非核糖体肽可用于免疫抑制剂、抗肿瘤剂、以及病毒、细菌和寄生虫感染。
53.更优选地,用于重组由目标多模块生物合成酶生物合成的有用物质(例如,聚酮或非核糖体肽)的宿主细胞可以来源于可由本发明的质粒转化而成的任何生物。因此,本发明的宿主细胞可以来源于原核生物或真核生物。然而,优选的宿主细胞由放线菌构成,更优选为streptomyces属的宿主。使用streptomyces属的宿主的最大优点在于,与使用大肠杆菌的异源表达生产相比,生产效价高,并且存在i型pks的活性表达所必需的翻译后修饰体系。具体而言,可以列举出s.albus、s.ambofaciens、s.avermitilis、s.azureus、s.cinnamonensis、s.coelicolor、s.curacoi、s.erythraeus、s.fradiae、s.galilaeus、s.glaucescens、s.hygroscopicus、s.lividans、s.parvulus、s.peucetius、s.rimosus、s.roseofulvus、s.thermotolerans、s.violaceoruber等,优选s.albus。
54.上述宿主细胞可以通过使用标准技术(例如,同源重组)使来源于该宿主细胞的编码由天然产生的多模块生物合成酶的基因(例如,pks基因或非核糖体肽合成酶基因)缺失来进行基因操作。
55.编码本发明的质粒中所包含的多模块生物合成酶的dna(例如,编码pks或非核糖体肽合成酶的dna)可以是天然型的,也可以是改变了密码子用法的dna,还可以是改变了1个或2个以上氨基酸的dna。在一个优选实施方式中,streptomyces pks包括3个开放阅读框(orf1、orf2、orf3)的产物。pks包含酮合成酶(ks)结构域、酰基转移酶(at)结构域、酰基载体蛋白(acp)这3种结构域,通过这3种结构域可以延长聚酮链。pks还可以具有酮还原酶(kr)结构域、脱水酶(dh)结构域、烯醇还原酶(er)结构域等与主链修饰相关的结构域。作为由pks制备的化合物,可以列举出6-脱氧红霉内酯b(6-deb)、富伦菌素、榴菌素、曲霉素、6-甲基水杨酸、土霉素、四环素、红霉素、甘油霉素、七尾霉素、美达霉素、柔红霉素、酪氨酸、卡波霉素、螺旋霉素、阿维菌素、莫能菌素、无活菌素、克拉霉素、脂霉素、利福霉素和杀念菌
素。
[0056]“非核糖体肽”是指属于由简单的氨基酸单体构成的复杂天然产物家族的肽类。这可以通过被称为非核糖体肽合成酶(nrps)的大型多功能蛋白质在多种细菌或真菌中合成。nrps系统的特征在于,能够合成包含蛋白质新生和非蛋白质新生氨基酸在内的肽。
[0057]“非核糖体肽合成酶”(nrps)是指在被称为模块的活性位点的协同组中组织而成的大型多功能蛋白质,在此,各模块是用于催化肽伸长和官能团修饰的1个循环所必需的部分。模块的数量和顺序、以及各nrps的模块内存在的结构域的类型,通过指示所摄入的氨基酸的数量、顺序、选择、以及与特定类型的伸长相关的修饰,来确定所得到的肽产物的结构变化。
[0058]
质粒包含与编码所需多模块生物合成酶的dna(例如,编码pks的dna)可操作地连接的控制序列。用于本发明的合适的表达系统包括在真核生物宿主细胞和原核生物宿主细胞中发挥作用的系统。然而,如上所述,原核生物系统是优选的,而且与streptomyces属细菌兼容的系统尤其重要。用于这种系统的控制序列包括启动子、核糖体结合位点、终止子、增强子等。有用的启动子在streptomyces属的宿主细胞中发挥功能,例如,可以列举出pgapdh、perme、pkaso等,但并不限定于此。
[0059]
选择标记也可以包含在质粒中。已知各种标记在转化细胞系的选择中是有用的,而且,通常,当细胞在适当的选择培养基中生长时,其表达包括赋予转化细胞上可选择的表型的基因。例如,这些标记包括赋予质粒以抗生素抗性或敏感性的基因。或者,一些聚酮本身是有颜的,其特征在于提供一种用于对由本发明的构建物成功转化而成的细胞进行选择与生俱来的(built-in)标记。
[0060]
质粒可以包含在宿主细胞中发挥功能的功能序列。作为功能序列,例如,可以列举出质粒复制起点序列、编码用于将质粒整合在宿主基因组中的酶的序列、接合(conjugation)起始点序列等。
[0061]
可以通过将控制序列、选择标记以及功能序列等嵌入到编码基因簇构建体中的多模块生物合成酶的多个基因的适当位置中,来使其包含在质粒中。
[0062]
将本发明的质粒导入适当的宿主细胞中的方法对于本领域的技术人员来说是公知的,而且代表性地包括使用cacl2或2价阳离子和如dmso那样的其他药剂。质粒也可以通过电穿孔导入宿主细胞中。一旦表达多模块生物合成酶(例如,pks),则可鉴定有用物质(例如,聚酮)产生菌落,而且可使用公知的技术进行分离。
[0063]
在本发明的一个优选实施方式中,将包含编码多模块生物合成酶的dna在内的区域从本发明的质粒转移到大肠杆菌的质粒中以改造质粒骨架(亚克隆),接着通过接合(conjugation)从大肠杆菌转移到streptomyces属微生物中,由此实施向宿主细胞的导入。由此,将编码多模块生物合成酶的dna整合到如streptomyces属微生物那样的宿主细胞基因组中。
[0064]
在一个实施方式中,本发明的质粒可以包含枯草芽孢杆菌、大肠杆菌和streptomyces属微生物中的复制起点序列、用于从大肠杆菌到streptomyces属微生物的接合转移的接合起始点序列(orit)以及编码将streptomyces属微生物整合到基因组中所需的整合酶的序列。这样的质粒从枯草芽孢杆菌中回收后,可以在无需进行用于改造质粒骨架的亚克隆的情况下,转化大肠杆菌,然后通过接合从大肠杆菌转移至streptomyces属微
生物。
[0065]
本发明的另一个优选实施方式是包含编码大的多模块生物合成酶的dna在内的质粒。例如,来源于streptomyces aureofaciens株tu117的脂霉素生物合成基因簇具有与7个模块相对应的开放阅读框(lippks1、lippks2、lippks3、lippks4、lipnrps、lipmt、lipte)。
[0066]
基因簇构建体只要是包含编码多模块生物合成酶的dna(例如,编码多模块生物合成酶中包含的结构域的dna)在内的构建体即可,而多模块生物合成酶的类型并没有特别限定。优选地,可以列举出用于构成pks或nrps的基因簇。此外,基因簇构建体的大小也没有特别限定。编码多模块生物合成酶的dna(例如,编码多模块生物合成酶中包含的结构域的dna)的类型不仅可以是具有微生物等天然来源序列的dna,也可以是具有人工设计序列的dna等,并没有特别限制。在天然来源序列中,为了表达对应的氨基酸,不同的生物物种主要使用一个密码子,但在进行异源表达时,优选使用与宿主的密码子使用频率相匹配的人工设计序列。可能影响异源表达结果的其他因素可以列举出gc含量(碱基序列内鸟嘌呤和胞嘧啶的总含量)、重复序列等。重复序列会降低遗传稳定性,存在错误杂交的风险,并阻碍重复片段的合成。因此,在异源表达的情况下,编码多模块生物合成酶的dna优选地与密码子使用量和gc含量相关联地进行优化。然而,这些要求通常很难同时得到最佳满足。例如,作为优化密码子的结果,可能会导致非常重复的dna序列或高gc含量。
[0067]
在本发明中,编码多模块生物合成酶的dna的gc含量为30~70%。编码多模块生物合成酶的dna的gc含量优选为70%以下、68%以下、65%以下、60%以下。通过使用本发明所涉及的方法,即使编码多模块生物合成酶的dna的gc含量为50%以上、52%以上、55%以上、58%以上、60%以上,也可以高效率地合成目的质粒。在本发明中,编码多模块生物合成酶的dna优选地优化密码子,以使得其不会出现20bp以上的碱基序列的重复。优选地避免编码多模块生物合成酶的dna中gc含量出现极端差异。例如,最高和最低的50bp长度间的gc含量的差异优选为52%以下。最好尽量减少均聚物。最好尽可能地使分散在编码多模块生物合成酶的dna内的小重复序列的数量/长度最小化。序列的重复性如表1所示,可以利用作为以重复序列的长度加权的重复次数的总和(sum(n_count x n length)for n=5to n=24)而计算出的分数进行评价。编码多模块生物合成酶的dna重复分数优选为1000以下、900以下。通过使用本发明,编码多模块生物合成酶的dna的重复分数可以为600以上。重复序列的长度小,且5~10bp的重复次数的总和优选为150以下、120以下、100以下、80以下、60以下。通过使用本发明,编码多模块生物合成酶的dna中所含的5~10bp长度的重复次数可以为50以上。
[0068]
pps基因是从nrps基因簇中的plipastatin基因簇获得的基因。lippks_original基因是从脂霉素pks基因簇获得的未修饰pks基因。lippks_optimized基因是本发明中使用的密码子优化脂霉素基因(表1、表2)。
[0069]
[表1]
[0070] gc5bp重复6bp重复7bp重复s8bp重复s9bp重复s10bp重复11bp重复12bp重复13bp重复14bp重复ppsa0.47321474322211ppsb0.45331464332222ppsc0.48291475322221ppsd0.47421695433222ppse0.45211154222211lippks1_original0.7495311710544332
lippks2_original0.7291331810654322lippks3_original0.7194311810644432lippks4_original0.718634189644332lippks1_optimized0.64361485432221lippks2_optimized0.644921115433222lippks3_optimized0.64482296432222lippks4_optimized0.644819105433222
[0071]
[表2]
[0072] 15bp重复16bp重复17bp重复18bp重复19bp重复20bp重复21bp重复22bp重复23bp重复24bp重复分数长度
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
ppsa11111111115507686ppsb11111111115857683ppsc11111111115567668ppsd222222222279610851ppse11111111114543840
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
lippks1_original222111111112456780lippks2_original2222222222130710749lippks3_original2222222222132510839lippks4_original222222222212839834
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
lippks1_optimized11111111116176780lippks2_optimized222111111181810749lippks3_optimized222111111180210839lippks4_optimized22211111117949834
[0073]
pps基因来自于2007年ogab论文中的plipastatin基因簇,在这篇论文中tsuge-sensei提出了nrps基因簇。lippks_original基因是来自于脂霉素pks基因簇的未修饰的pks基因。
[0074]
lippks_optimized基因是本研究中使用的经密码子优化的脂霉素基因。
[0075]
分数是按由重复长度加权的重复计数的总和来计算的:
[0076]
n=5至n=24的总和(n_计数x n长度)
[0077]
编码多模块生物合成酶的dna(例如,编码多模块生物合成酶中包含的结构域的dna)的大小优选为100kda以上、200kda以上、300kda以上、400kda以上、500kda以上、600kda以上、700kda以上、800kda以上、900kda以上、1000kda以上。
[0078]
基因簇构建体由具有可交替连接的结构的多个dna片段构成。所谓可连接,是指在基因簇构建体上具有相邻序列的dna片段可以保持一定的顺序和方向进行连接。具体而言,作为所述dna片段,例如,可以列举出具有末端的片段,该末端利用片段的粘性末端的碱基序列的互补性,能够在相互保持顺序的状态下重复连接。该粘性末端的结构只要是除回文结构(palindrome)以外的结构即可,还包括5'末端突出、3'末端突出的形状的不同,并没有特别限制。但是,在制备dna片段时,优选地通过限制性核酸内切酶的消化来制备突出末端。作为限制性核酸内切酶,当使用用于可识别特定的序列并在其附近制作任意序列的突出末端的酶时,由于dna片段的粘性末端在各连接位点会有所不同,因此可保持其连接顺序。通过适当地设计各dna片段的粘性末端的序列,可以得到包含多个dna(例如,编码pks或nrps的dna))的基因簇构建体,其中,该多个dna用于编码各dna片段以预定的顺序进行排列的多模块生物合成酶。作为这些限制性核酸内切酶的例子,除了通常的分子生物学中使用的限制性核酸内切酶以外,还可以列举出人工限制性核酸内切酶的talen或znf、或者crispr-cpf1等可生成粘性末端的crispr技术的相关酶等,优选使用如aari、alwni、bbsi、bbvi、
bcodi、bfuai、bgli、bsai、bsaxi、bsmai、bsmbi、bsmfi、bspmi、bspqi、btgzi、draiii、foki、pflmi、sfani、sfii等这样的typeii限制性核酸内切酶。通过使用nebeta
tm tools,可以确定最佳的粘性末端。粘性末端的碱基数优选为3~6,更优选为3~4。1个dna片段中所含的碱基数优选为1~5kb。也可以是2kb以上、3kb以上、4kb以上。用于生成粘性末端的限制性核酸内切酶的类型数量对于1个dna片段的切割,优选利用1种限制性核酸内切酶进行切割。未必需要通过同一种的限制性核酸内切酶的消化来得到所有的dna片段,但使用的限制性核酸内切酶的类型的总数越少越好,优选为3种以下,更优选为2种以下,进一步优选为1种。
[0079]
所述基因簇构建体除了编码多模块生物合成酶的dna(例如,编码多模块生物合成酶中包含的结构域的dna)以外,还可以包含其他基因。例如,当基因簇构建体包含pks基因的情况下,除了pks基因以外,为了修饰最终的聚酮产物、将聚酮输送到细胞外、或赋予对抗生素聚酮的抗性,重要的是还包含其他非pks基因。
[0080]
作为dna片段的类型,为3~60(种),优选为5~50(种),更优选为8~40(种),进一步优选为10~30(种)。
[0081]
在本发明所涉及的制备基因簇构建体的方法的工序(a)中,制备多个dna片段,其中,该多个片段能够重构基因簇构建体并且具有可交替连接的结构。也可以通过用限制性核酸内切酶切割各dna片段来形成可交替连接的结构的粘性末端。或者,也可以通过合成包含各dna片段的质粒,并用限制性核酸内切酶进行切割,来制备具有可交替连接的结构的粘性末端的各dna片段。各dna片段的gc含量可以为65%以下。优选地,各dna片段不会出现20bp以上的碱基序列的重复。各dna片段的长度也可以不一致。优选地,具有相同粘合序列的dna片段的长度一致。
[0082]
在本发明所涉及的制备基因簇构建体的方法的工序(b)中,将工序(a)中制备的多个dna片段混合在溶液中。进行混合以使得所有dna片段的摩尔浓度比为0.8~1.2,优选为0.9~1.1,更优选为0.95~1.05,进一步优选为约1.0。dna片段的混合根据需要在存在合成用质粒的情况下进行,从而使dna片段聚集,并得到包含编码多模块生物合成酶的多个基因簇的串联重复序列在内的构建体。通过将得到的基因簇构建体导入枯草芽孢杆菌中,得到包含编码多模块生物合成酶的基因簇在内的质粒库,将该质粒库的多模块生物合成酶的基因簇转移到穿梭质粒中,并利用与大肠杆菌的conjugation转移到如streptomyces属细菌那样的适当的宿主细胞中,从而可以在宿主细胞中表达多模块生物合成酶。例如,当上述组合文库由针对各基因具有不同强度或表达量的启动子的质粒构成的情况下,通过在适当的宿主细胞中表达多模块生物合成酶,可以发现用于高表达的优选启动子的组合。
[0083]
在本发明所涉及的制备基因簇构建体的方法的工序(p)中,制备多个质粒(种子质粒)。考虑到工序(a1)和工序(b1),种子质粒可以具有以下结构:以在构建聚集体之后将其分割成dna片段的方式,根据各自的设计,在dna片段的边界或其附近导入适当的限制性核酸内切酶识别序列。作为限制性核酸内切酶,优选使用如aari、alwni、bbsi、bbvi、bcodi、bfuai、bgli、bsai、bsaxi、bsmai、bsmbi、bsmfi、bspmi、bspqi、btgzi、draiiifoki、pflmi、sfani、sfii等那样可制备任意序列的粘性末端的酶。通过这些限制性核酸内切酶处理而得到的多个粘合序列可以在单一种类的质粒内成为唯一的序列。此外,种子质粒也可以在组合文库的重组单位(多数情况下一个dna片段与该单位一致,但在某些情况下,重组单位有时在一部分的种子质粒中由多个dna片段构成。)中,在同一链上以相同的顺序具有相同
的粘合序列。
[0084]
在本发明所涉及的制备基因簇构建体的方法的工序(a1)中,通过将多种种子质粒分别用适合的限制性核酸内切酶进行处理,来制备多种dna片段的混合液。作为限制性核酸内切酶,可以列举出上述例示的酶。所得的限制性核酸内切酶消化物包含所需的dna片段和来源于质粒的片段。在本发明的一个优选实施方式中,本发明中使用的dna片段和来源于种子质粒的片段的大小不同,因此通过电泳对它们的大小进行分级,从而可以得到所需dna片段的近似等摩尔量的混合物。所谓近似等摩尔量的混合物,是指所有dna片段的摩尔浓度比为0.8~1.2的范围,优选为0.9~1.1的范围,更优选为0.95~1.05的范围,进一步优选为约1.0。
[0085]
在本发明所涉及的制备基因簇构建体的方法的工序(b1)中,根据需要,通过将工序(a1)中得到的所需dna片段的近似等摩尔量的混合物在聚集用质粒的存在下进行再聚集,来得到包含编码多模块生物合成酶的多个基因簇的串联重复序列在内的基因簇构建体。使用所得到的基因簇构建体,以与上述(b)的记载相同的方式得到质粒库。质粒库使用对构成簇的基因序列和宿主细胞中的启动子强度等控制序列中的至少1种进行各种变更而成的序列并在宿主细胞中表达,从而可以筛选出高表达多模块生物合成酶基因簇。
[0086]
也可以通过使用dna连接酶等连接(连接)dna片段混合液来制备基因簇构建体,但由上述工序(p)得到的各dna片段并不只限定于基因聚集的起始材料,只要是最终能够如上述那样分割成各dna片段的结构即可,也可以利用通过任意聚集方法来准备的聚集体。在此,dna片段混合液中的所有dna片段的摩尔浓度比为0.8~1.2的范围,优选为0.9~1.1的范围,更优选为0.95~1.05的范围,进一步优选为约1.0。
[0087]
dna片段的连接方法并没有特别限制,但最好在聚乙二醇和盐的存在下进行连接。作为盐,优选为一价碱金属盐。优选地,用t4dna聚合酶在37℃下持续30分钟以上。
[0088]
例如,当编码pks的dna由按照p、q、r、s的顺序连接了4个结构域的p-q-r-s进行表示的情况下,基因簇构建体包括由-(p-q-r-s)
n-表示的串联重复序列(n为2以上的整数)。优选地,在基因簇构建体的各orf(p-q-r-s)的5'末端或3'末端上附加在宿主细胞中发挥功能的启动子、核糖体结合序列(rbs序列)、增强子等控制序列。此外,也可以在基因簇构建体的各orf(p-q-r-s)的5'末端或3'末端上附加在宿主细胞中发挥功能的功能序列、以及选择标记等序列。此外,基因簇构建体优选地包括对枯草芽孢杆菌有效的复制起点。例如,在枯草芽孢杆菌的情况下,具有θ型复制机制,具体而言,可以列举出ptb19(imanaka,t.,et al.,j.gen.microbioi.,130,1399-1408.(1984))和pls32(tanaka,t and ogra,m.,febs lett.,422,243-246.(1998)、pamβ1(swinfield,t.j.,et al.,gene,87,79-90.(1990))等质粒中含有的复制起点等序列。
[0089]
通过将枯草芽孢杆菌感受态细胞与基因簇构建体一起培养,来将基因簇构建体摄入至枯草芽孢杆菌内,从而形成包含编码多模块生物合成酶的dna(例如,编码pks或nrps的dna)在内的质粒。作为枯草芽孢杆菌感受态细胞的制备方法,优选使用anagnostopoulou,c.and spizizen,j.,j.bacteriol.,81,741-746(1961)中记载的方法。加入到枯草芽孢杆菌感受态细胞中的基因簇构建体溶液的液量并没有特别限制。相对于枯草芽孢杆菌感受态细胞的培养液的液量,基因簇构建体溶液的液量优选为1/20至等量的范围内,更优选为半量。
[0090]
编码多模块生物合成酶的dna(例如,编码pks或nrps的dna)串联重复序列在形成质粒时,将编码串联重复序列中的至少1个、优选地将编码1个多模块生物合成酶的dna(例如,编码pks或nrps的dna)整合到质粒中。作为从枯草芽孢杆菌中纯化质粒的方法,可以使用公知的方法。
[0091]
通过上述方法而得到的质粒具有编码目标多模块生物合成酶的dna(例如,编码pks或nrps的dna),这可以通过限制性核酸内切酶切割而产生的片段的大小模式、pcr法、碱基序列确定法来确认。
[0092]
终止子只要是在所述宿主细胞中发挥功能的终止子即可,并没有特别限定,例如可以优选地列举出来源于fd噬菌体的终止子(fd-ter)、来源于t4噬菌体的终止子(t4-ter)及来源于t7噬菌体的终止子(t7-ter)等。其中,从上述稳定化效果更佳的观点出发,特别优选为来源于fd噬菌体的终止子。
[0093]
可以使用公知的核糖体结合序列(rbs)。
[0094]
在本发明的一个实施方式中,可以培养将包含编码多模块生物合成酶的dna(例如,编码pks或nrps的dna)在内的质粒导入宿主细胞的转化子,并通过该培养物得到有用物质(例如,聚酮或非核糖体肽)。所谓“培养物”,是指培养上清、培养细胞、培养菌体、或细胞或菌体的破碎物中的任一种。培养本发明的转化子的方法可以按照宿主培养使用的通常方法来进行。
[0095]
培养本发明的转化子的培养基只要是含有宿主可同化的碳源、氮源、无机盐类等且能够有效地培养转化子的培养基即可,也可以使用天然培养基、合成培养基中的任一种。作为碳源,可以列举出葡萄糖、半乳糖、果糖、蔗糖、棉子糖、淀粉等碳水化合物、乙酸、丙酸等有机酸、乙醇、丙醇等醇类。作为氮源,可以列举出氨、氯化铵、硫酸铵、醋酸铵、磷酸铵等无机酸或有机酸的铵盐或其他含氮化合物。除此之外,也可以使用蛋白胨、肉提取物、玉米浆、各种氨基酸等。作为无机物,可以列举出磷酸二氢钾、磷酸氢二钾、磷酸镁、硫酸镁、氯化钠、硫酸亚铁、硫酸锰、硫酸铜、碳酸钙等。
[0096]
培养通常在温度28~38℃、振荡培养或通气搅拌培养等好氧的条件下进行。ph的调整通过使用无机或有机酸、碱溶液等来进行。
[0097]
在上述培养条件下培养时,可以高收率地生产有用物质(例如,聚酮)。
[0098]
培养后,当在菌体内或细胞内生产有用物质(例如聚酮)的情况下,可以通过实施均质器处理等来使菌体或细胞破碎,从而提取该有用物质。另一方面,当有用物质(例如聚酮)分泌到菌体外或细胞外的情况下,直接使用培养液、或通过离心分离等去除菌体或细胞。然后,通过硫酸铵沉淀提取等从所述培养物中提取该有用物质,根据需要进一步使用各种谱等进行分离纯化。
[0099]
模块化pks在模块内依次催化多个化学反应,各结构域的空间配置也很重要。在过去几年中,一些研究已确定了pks模块和结构域交换的最佳融合边界候选,但由于蛋白质序列不同,因此该空间配置可能因模块而异。这意味着组合生物合成的最佳边界位置可能取决于内容物。因此,通过使用本发明,可以使用各种结构域边界来执行at结构域交换等的有针对性的变更,并且可以用in vitro评价所得酶的活性。
[0100]
实施例
[0101]
下面,根据实施例对本发明进行说明,但本发明并不限定于这些实施例。
[0102]
图1是示意性地示出实施例1和2的顺序的图。图1中,位于箭头下方的示意图分别表示包含编码多模块生物合成酶的多个基因在内的基因簇构建体。在各基因簇构建体中,启动子、rbs、编码多模块生物合成酶的基因(cds)与终止子的组合经由间隔序列排列多个。在实施例1和2中,通过将具有可交替连接的结构的多个dna片段(图1中箭头上方的示意图)进行连接来获得该基因簇构建体。另外,在实施例1中,通过一次连接所有dna片段来获得基因簇构建体。在实施例2中,将dna片段分为3个组,在各个组中一旦得到基因簇构建体并将其作为质粒后,将3个组中得到的质粒放在一起,之后再次分解为dna片段,接着进行连接以得到基因簇构建体。另外,在连接dna片段时,还包含作为载体骨架的dna片段。
[0103]
实施例1和2
[0104]
《dna设计》
[0105]
作为编码多模块生物合成酶的多个基因,利用了以下基因序列。以下的基因序列选自来源于streptomyces aureofaciens株tu117的脂霉素生物合成基因簇。
[0106]
lippks1
[0107]
lippks2
[0108]
lippks3
[0109]
lippks4
[0110]
lipnrps
[0111]
lipmt
[0112]
lipte
[0113]
对所有的cds进行自定义设计,并进行密码子优化,以使gc含量小于70%且不会出现20bp以上的重复。还取得了在目标生产宿主(链霉菌浴)中有效表达的必要条件的平衡。
[0114]
密码子优化前的gc含量(%):
[0115]
lippks1:74.2%
[0116]
lippks2:72.3%
[0117]
lippks3:71.3%
[0118]
lippks4:71.3%
[0119]
lipnrps:75.2%
[0120]
lipmt:71.1%
[0121]
lipte:74.5%
[0122]
密码子优化后的gc含量(%):
[0123]
lippks1:63.7%
[0124]
lippks2:63.7%
[0125]
lippks3:63.9%
[0126]
lippks4:63.9%
[0127]
lipnrps:65.3%
[0128]
lipmt:59.6%
[0129]
lipte:65.7%
[0130]
从cds(bsmbi、bsai、aari)中删除了在组合文库和载体转移的组装中使用的所有的原生限制性核酸内切酶识别位点。
[0131]
得到的序列优化cds用于通过使用链霉菌的启动子和rbs序列来设计新的基因簇。
[0132]
具体而言:
[0133]
启动子和rbs配置在各pks cds之前,终止子和间隔序列配置在各cds的最后。实施例中使用的启动子的序列如序列号14~23所示。
[0134]
在一个启动子的控制下,将lipnrps、lipmt和lipte基因集中放到单个操纵子中。3个cds分别保留了独自的rbs。终止子配置在该操纵子的最后。
[0135]
因此,所设计的基因簇构建体重复如下序列:载体骨架的序列、以及依次包含在cds之前包含启动子和rbs且在cds之后包含终止子和间接序列的lippks1基因(基因1)、lippks2基因(基因2)、lippks3基因(基因3)、lippks4(基因4)基因和上述操纵子(基因5)的序列。
[0136]
《组装》
[0137]
实施例1(直接ogab法)
[0138]
用uv分光光度计(thermofisher nanodrop)测量包含启动子变体的所有dna片段(序列号1~13及28~37)的浓度,并制备等摩尔的片段混合物。利用dnase(lucigen corporation)进行处理,并去除混入的线状dna。相对于各dna片段,浓度标准化为100ng/μl。将500ng的各dna片段集中放于管中,用bsai-hfv2限制性核酸内切酶(neb)进行处理。为了纯化用限制性核酸内切酶消化的dna,进行苯酚氯仿处理、丁醇处理、乙醇沉淀。使用透析管进行凝胶提取,从消化的质粒混合物中去除靶片段,并将得到的消化后的靶片段用乙醇沉淀法进行纯化。将消化后的片段与消化的载体(ogab载体1.0)、1μl的t4 dna ligase(takara bio)以及连接酶缓冲液混合,在37℃下孵育3小时后,完成连接,并得到所设计的基因簇构建体。将包含基因簇构建体的dna连接酶溶液与枯草芽孢杆菌感受态细胞混合,将细胞在37℃下进行短时间的孵育后铺展在四环素选择板上。菌落增殖一段时间后,从板上拾起转化子,并在37℃下于2ml lb中增殖一晚。质粒提取按照以往的方案进行,通过限制消化模式(限制性核酸内切酶:noti的切割模式)来确认所得到的质粒是否按照预想的那样进行了组装。另外,ogab载体1.0的碱基序列如序列号24所示。图3是ogab载体1.0的载体图。
[0139]
图2是示出所得到的质粒的限制性消化模式的一例的图片。在所分析的24个菌落中,按照预想的那样进行组装的菌落数量为20(20/24=83%)。
[0140]
实施例2(标准ogab法)
[0141]
组1:dna片段(序列号1~13)
[0142]
组2:dna片段(序列号1~3、5~9及28~32)
[0143]
组3:dna片段(序列号1~3、5~9及33~37)
[0144]
首先,分别对上述组1~组3,按照与实施例1相同的步骤得到质粒。然后,使用组1~组3的质粒代替dna片段,按照与实施例1相同的步骤得到重组后的质粒。以与实施例1相同的方式通过限制消化模式来确认所得到的质粒是否按照预想的那样进行了组装。结果,在所分析的24个菌落中,按照预想的那样进行组装的菌落数量为23(23/24=96%)。
[0145]
在实施例1和实施例2中,插入至5处启动子位置(参照图1)处的启动子的类型都是随机的,并没有发现明显的偏差。即,能够构建没有偏差的组合文库。此外,使用flongle(oxford nanopore technologies公司制造)对通过限制消化模式按照预想的那样进行组装的质粒的碱基序列进行解读,其结果发现与所设计的碱基序列非常一致(约60kbp中,
99.96%匹配)。
[0146]
实施例3
[0147]
用限制性核酸内切酶aari从仅使用实施例2的组1的dna片段得到的质粒中切除lippks基因簇,连接到e.coli-streptomyces穿梭载体(psyn0002,序列号38)的限制性核酸内切酶aari位点,并用e.coli(et12567(puz8002))进行克隆。使用该e.coli,接合转移到streptomyces中,并确认lippks基因簇的表达。
[0148]
实施例4
[0149]
除了使用直接穿梭载体(ogab载体2.0,序列号25)代替实施例1的ogab载体1.0、以及作为dna片段使用具有序列号1~13所示的碱基序列的dna片段以外,其他以与实施例1相同的方法得到质粒。图4是ogab载体2.0的载体图。ogab载体2.0包含枯草芽孢杆菌、大肠杆菌和streptomyces属微生物中的复制起始点序列、用于从大肠杆菌接合转移到streptomyces属微生物的接合起始点序列(orit)以及将streptomyces属微生物插入到基因组所需的位点特异性重组系统(编码phic 31整合酶的序列和phic31 attp序列)。将得到的质粒转化到e.coli中,使用该e.coli,接合转移到streptomyces中,并确认lippks基因簇的表达。
[0150]
实施例5
[0151]
除了使用直接穿梭载体(ogab载体2.1,序列号26)代替实施例4的ogab载体2.0以外,其他按照与实施例4相同的步骤接合转移到streptomyces中,并确认lippks基因簇的表达。图5是ogab载体2.1的载体图。ogab载体2.1是将ogab载体2.0中的streptomyces属微生物插入到基因组所需的位点特异性重组系统变更为编码phibt1整合酶的序列和phibt1 attp序列的载体。
[0152]
实施例6
[0153]
除了使用直接穿梭载体(ogab载体2.2,序列号27)代替实施例4的ogab载体2.0以外,其他按照与实施例4相同的步骤接合转移到streptomyces中,并确认lippks基因簇的表达。图6是ogab载体2.2的载体图。ogab载体2.2是在ogab载体2.1中追加了编码整合酶(tyrosine-type recombinase)和氯霉素抗性基因的序列的载体。

技术特征:


1.一种方法,具体是一种制备包含编码多模块生物合成酶的多个基因在内的基因簇构建体的方法,其包括以下工序:(a)制备可重构所述基因簇构建体并具有可交替连接结构的多个dna片段的工序;(b)通过将工序(a)中制备的多个dna片段在溶液中混合来交替连接多个dna片段,从而得到基因簇构建体的工序。2.根据权利要求1所述的方法,其中,所述dna片段各自包含在质粒中,并且还包括由所述质粒制备所述工序(a)的dna片段的工序。3.一种方法,具体是一种制备包含编码多模块生物合成酶的多个基因在内的基因簇构建体的方法,其包括以下工序:(p)制备包含具有可交替连接的结构的多个dna片段在内的多种质粒的工序;(a1)分别用适合的限制性核酸内切酶处理多种所述质粒,并制备多种dna片段的混合液的工序;以及(b1)使用在工序(a1)中得到的dna片段的混合液,使dna片段再聚集以得到所述基因簇构建体的工序。4.根据权利要求3所述的方法,其中,在所述工序(p)中,制备包含多个dna片段的多种质粒,该dna片段具有能够通过使用枯草芽孢杆菌来交替连接的结构。5.根据权利要求1至4中任一项所述的方法,其中,所述多模块生物合成酶是模块化聚酮合酶(pks)。6.根据权利要求3所述的方法,其中,所述限制性核酸内切酶是typeii限制性核酸内切酶。7.一种制备质粒组合文库的方法,其中,将通过权利要求1至6中任一项所述的方法制备的所述基因簇构建体转化为枯草芽孢杆菌,并从枯草芽孢杆菌中回收质粒dna。8.根据权利要求3所述的方法,其中,选择多种通过权利要求7所述的制备方法来得到的质粒,将其作为所述工序(a1)中的质粒进行再利用,并实施所述工序(a1)和所述工序(b1)。9.一种通过权利要求7所述的制备方法来得到的质粒组合文库。10.一种通过将权利要求9所述的质粒转化到宿主细胞中来制备多模块生物合成酶的方法。11.根据权利要求10所述的方法,其中,所述宿主细胞是streptomyces属的微生物。

技术总结


本发明涉及一种方法,具体是一种制备包含编码多模块生物合成酶的多个基因在内的基因簇构建体的方法,其包括以下工序:(A)制备可重构基因簇构建体并具有可交替连接结构的多个DNA片段的工序;(B)通过将工序(A)中制备的多个DNA片段在溶液中混合来交替连接多个DNA片段,从而得到基因簇构建体的工序。从而得到基因簇构建体的工序。


技术研发人员:

大卫

受保护的技术使用者:

丝芭博株式会社

技术研发日:

2021.05.25

技术公布日:

2023/2/3

本文发布于:2024-09-20 16:55:57,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/67080.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:基因   质粒   片段   序列
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议