CRISPR与反转录子的组合物系统及用途


crispr与反转录子的组合物系统及用途
技术领域
1.本发明涉及生物技术领域,具体地,涉及一种crispr与反转录子的组合物系统及用途。


背景技术:



2.自2013年crispr/cas9被发表于应用真核生物细胞中的基因编辑。此后,基于crispr/cas9系统的基因编辑技术得到了极大的发展。该系统仅由两个部分组成:负责定位靶位点序列的引导rna(guide rna,grna)和核酸内切酶cas9蛋白。二者配合能够高效特异的靶向切割目的位点,造成dna双链断裂(double strain break,bsd),从而允许人们利用细胞自身的非同源重组修复(non-homologous end joining,nhej)途径产生dna片段的缺失或引起移码突变,从而造成基因的敲除。人们也可以利用细胞的同源重组修复(homology directed repair,hdr)途径对靶位点进行精确的dna片段替换或者敲入。然而,传统的同源重组方法需要提供cas9/grna的同时,还需要将供体dna递送到细胞中去,这极大地限制了在体基因编辑的应用。
3.并且目前的编辑系统由于效率太低,迄今为止未能在人类细胞中进行基因编辑。
4.因此,通过筛选新的,更高效的反转录子来开发新型基因编辑系统对于基因和作物育种等应用具有非常重要的意义。


技术实现要素:



5.本发明的目的在于提供一种新的,更高效的反转录子来开发新型基因编辑系统。
6.本发明第一方面提供了一种融合蛋白,所述融合蛋白的结构如下式i或i’所示:
7.a-l-b
ꢀꢀꢀ(i)8.b-l-a
ꢀꢀꢀ
(i’)
9.式中,
10.a为基因编辑蛋白,
11.b为反转录酶,所述反转录酶选自下组:ec73、ec107、或其组合。
12.l为无或连接肽,
13.各
“‑”
独立地为连接肽或肽键或非肽键。
14.在另一优选例中,所述非肽键包括peg。
15.在另一优选例中,所述基因编辑蛋白选自下组:cas9、cas12a、cas12b、或其组合。
16.在另一优选例中,所述基因编辑蛋白包括野生型或突变型的基因编辑蛋白。
17.在另一优选例中,所述基因编辑蛋白选自下组:酿脓链球菌(streptococcus pyogenes)、葡萄球菌(staphylococcus aureus)、氨基酸球菌属(acidaminococcus sp)、毛螺科菌(lachnospiraceae bacterium)、或其组合。
18.在另一优选例中,所述连接肽的长度为1-100aa,较佳地,10-85aa,更佳地,15-70aa。
19.在另一优选例中,所述连接肽的氨基酸序列选自下组:
20.(1)氨基酸序列如seq id no.:1所示的多肽;
21.(2)将seq id no.:1所示氨基酸序列经过一个或几个,优选1-20个、更优选1-15个、更优选1-10个、更优选1-8个、更优选1-3个、最优选1个氨基酸残基的取代、缺失或添加而形成的,具有(1)所述多肽功能的由seq id no.1所示氨基酸序列的多肽衍生的多肽。
22.在另一优选例中,所述基因编辑蛋白的氨基酸序列选自下组:
23.(1)氨基酸序列如seq id no.:2所示的多肽;
24.(2)将seq id no.:2所示氨基酸序列经过一个或几个,优选1-20个、更优选1-15个、更优选1-10个、更优选1-8个、更优选1-3个、最优选1个氨基酸残基的取代、缺失或添加而形成的,具有(1)所述多肽功能(比如,具有双链dna切割活性)的由seq id no.2所示氨基酸序列的多肽衍生的多肽。
25.在另一优选例中,所述反转录酶的氨基酸序列选自下组:
26.(1)氨基酸序列如seq id no.:3-4任一所示的多肽;
27.(2)将seq id no.:3-4任一所示的氨基酸序列经过一个或几个,优选1-20个、更优选1-15个、更优选1-10个、更优选1-8个、更优选1-3个、最优选1个氨基酸残基的取代、缺失或添加而形成的,具有(1)所述多肽功能(比如,具有双链dna切割活性)的由seq id no.3-4任一所示氨基酸序列的多肽衍生的多肽。
28.在另一优选例中,所述融合蛋白还包括核定位信号片段。
29.在另一优选例中,所述核定位信号片段包括sv40 nls。
30.在另一优选例中,所述核定位信号片段的氨基酸序列选自下组:
31.(1)氨基酸序列如seq id no.:5所示的多肽;
32.(2)将seq id no.:5所示的氨基酸序列经过一个或几个,优选1-20个、更优选1-15个、更优选1-10个、更优选1-8个、更优选1-3个、最优选1个氨基酸残基的取代、缺失或添加而形成的,具有(1)所述多肽功能的由seq id no.5所示氨基酸序列的多肽衍生的多肽。
33.在另一优选例中,所述融合蛋白的氨基酸序列选自下组:
34.(1)氨基酸序列如seq id no.:6-7任一所示的多肽;
35.(2)将seq id no.:6-7任一所示的氨基酸序列经过一个或几个,优选1-20个、更优选1-15个、更优选1-10个、更优选1-8个、更优选1-3个、最优选1个氨基酸残基的取代、缺失或添加而形成的,具有(1)所述多肽功能(比如,具有双链dna切割活性)的由seq id no.6-7任一所示氨基酸序列的多肽衍生的多肽。
36.在另一优选例中,所述融合蛋白具有seq id no.:6-7中任一所示的氨基酸序列。
37.本发明第二方面提供了一种嵌合rna,所述嵌合rna具有式ii所示的结构:
38.c-z-d
ꢀꢀꢀ
(ii)
39.式中,
40.c为反转录子的非编码rna(ncrna),所述反转录子选自下组:ec73、ec107、或其组合;
41.z为无或接头序列(linker);
42.d为grna,所述grna引导基因编辑蛋白特异性结合靶标核酸分子的rna;
43.各
“‑”
独立地为键或核苷酸连接序列。
44.在另一优选例中,所述反转录子的非编码rna的核酸序列包括:
45.a)msr区域;
46.b)msd区域,所述msd区域与msr区域的3’端相邻;
47.c)供体序列,所述供体序列位于msd区域中间;
48.d)一对反向互补的序列,其分别与msr的5’端和msd的3’端相邻。
49.在另一优选例中,所述转录子的非编码rna的核酸序列选自下组:
50.(i)序列如seq id no.:8或9所示的多核苷酸;
51.(ii)核苷酸序列与seq id no.:8或9所示序列的同源性≥80%,较佳地≥95%(更佳地≥98%,更佳地≥99%)的多核苷酸;
52.(iii)在seq id no.:8或9所示多核苷酸的5’端和/或3’端截短或添加1-60个(较佳地1-30,更佳地1-10个)核苷酸的多核苷酸;
53.(iv)与(i)-(iii)任一所述的多核苷酸互补的多核苷酸。
54.在另一优选例中,所述grna的核酸序列包括:
55.a)骨架rna序列,其与基因编辑蛋白结合;
56.b)向导rna序列,其与靶标核酸分子相同。
57.在另一优选例中,所述骨架rna序列选自下组:
58.(i)序列如seq id no.:10所示的多核苷酸;
59.(ii)核苷酸序列与seq id no.:10所示序列的同源性≥80%,较佳地≥95%(更佳地≥98%,更佳地≥99%)的多核苷酸;
60.(iii)在seq id no.:10所示多核苷酸的5’端和/或3’端截短或添加1-60个(较佳地1-30,更佳地1-10个)核苷酸的多核苷酸;
61.(iv)与(i)-(iii)任一所述的多核苷酸互补的多核苷酸。
62.在另一优选例中,所述靶标核酸分子选自下组:emx1、hek3、或其组合。
63.在另一优选例中,所述的c和d通过接头序列、碱基互补配对或磷酸二酯键连接。
64.在另一优选例中,所述的z的长度为0-80nt,较佳地0-50nt,更佳地0-10nt。
65.在另一优选例中,所述嵌合rna的序列选自下组:
66.(i)序列如seq id no.:11-12所示的多核苷酸;
67.(ii)核苷酸序列与seq id no.:11-12所示序列的同源性≥80%,较佳地≥95%(更佳地≥98%,更佳地≥99%)的多核苷酸;
68.(iii)在seq id no.:11-12所示多核苷酸的5’端和/或3’端截短或添加1-60个(较佳地1-30,更佳地19-22个)核苷酸的多核苷酸;
69.(iv)与(i)-(iii)任一所述的多核苷酸互补的多核苷酸。
70.本发明第三方面提供了一种基因编辑试剂,包括:
71.(a)本发明第一方面所述的融合蛋白、或其编码基因或其表达载体;和
72.(b)本发明第二方面所述的嵌合rna或其表达载体。
73.在另一优选例中,所述表达载体包括病毒载体。
74.在另一优选例中,所述的病毒载体选自下组:腺相关病毒(aav)、腺病毒、慢病毒、逆转录病毒、疱疹病毒、sv40、痘病毒、或其组合。
75.在另一优选例中,所述的载体选自下组:慢病毒、腺病毒、腺相关病毒(aav)、或其
组合,较佳地,所述载体为腺相关病毒(aav)。
76.本发明第四方面提供了一种试剂盒,所述试剂盒包括本发明第三方面所述的基因编辑试剂。
77.在另一优选例中,所述试剂盒还包括标签或说明书。
78.本发明第五发明提供了一种组合物,包括:
79.(a)本发明第一方面所述的融合蛋白、或其编码基因或其表达载体;和
80.(b)本发明第二方面所述的嵌合rna或其表达载体。
81.在另一优选例中,所述组合物包括药物组合物。
82.在另一优选例中,所述组合物还包括其他提高基因编辑效率的物质。
83.在另一优选例中,所述其他提高基因编辑效率的物质选自下组:scr7、nu-7441、或其组合。
84.在另一优选例中,所述表达载体包括病毒载体。
85.在另一优选例中,所述的病毒载体选自下组:腺相关病毒(aav)、腺病毒、慢病毒、逆转录病毒、疱疹病毒、sv40、痘病毒、或其组合。
86.在另一优选例中,所述的载体选自下组:慢病毒、腺病毒、腺相关病毒(aav)、或其组合,较佳地,所述载体为腺相关病毒(aav)。
87.在另一优选例中,所述融合蛋白的编码基因与嵌合rna位于同一表达载体(如aav载体)或不同的表达载体。
88.在另一优选例中,所述融合蛋白的表达载体与嵌合rna的表达载体为同一表达载体(如aav载体)或不同的表达载体。
89.在另一优选例中,所述组合物的剂型选自下组:冻干制剂、液体制剂、或其组合。
90.在另一优选例中,所述组合物的剂型为液体制剂。
91.在另一优选例中,所述组合物的剂型为注射剂型。
92.在另一优选例中,所述组合物为细胞制剂。
93.在另一优选例中,所述融合蛋白的表达载体和嵌合rna的表达载体为同一载体或不同载体。
94.在另一优选例中,所述组分(a)与组分(b)的摩尔比为100:1-0.01:1,较佳地,10:1-0.1:1,更佳地,2:1-0.5:1。
95.在另一优选例中,所述组合物中,所述组分(a)的含量为0.001%-99%,较佳地,50%-99%,更佳地,90%-99%。
96.在另一优选例中,所述组合物中,所述组分(b)的含量为0.001%-99%,较佳地,0.1%-50%,更佳地,0.1%-10%。
97.在另一优选例中,所述组合物中,所述组分(a)和组分(b)占所述组合物总重的0.01-99.99wt%,较佳地0.1-90wt%,更佳地1-80wt%。
98.本发明第六方面提供了一种药盒,包括:
99.(a1)第一容器,以及位于所述第一容器中的本发明第一方面所述的融合蛋白、或其编码基因或其表达载体,或含有本发明第一方面所述的融合蛋白、或其编码基因或其表达载体的药物;
100.(b1)第二容器,以及位于所述第二容器中的本发明第二方面所述的嵌合rna或其
表达载体,或含有本发明第二方面所述的嵌合rna或其表达载体的药物。
101.在另一优选例中,所述药盒还包括:
102.(c1)第三容器,以及位于所述第三容器中的其他提高基因编辑效率的物质,和/或含有其他提高基因编辑效率的物质的药物。
103.在另一优选例中,所述的第一容器和第二容器、第三容器是相同或不同的容器。
104.在另一优选例中,所述的第一容器的药物是含本发明第一方面所述的融合蛋白、或其编码基因或其表达载体的单方制剂。
105.在另一优选例中,所述的第二容器的药物是含本发明第二方面所述的嵌合rna或其表达载体的单方制剂。
106.在另一优选例中,所述的第三容器的药物是含其他提高基因编辑效率的物质的单方制剂。
107.在另一优选例中,所述药物的剂型选自下组:冻干制剂、液体制剂、或其组合。
108.在另一优选例中,所述药物的剂型为口服剂型或注射剂型。
109.在另一优选例中,所述的试剂盒还含有说明书。
110.本发明第七方面提供了一种本发明第一方面所述的融合蛋白、本发明第二方面所述嵌合rna、本发明第三方面所述的基因编辑试剂或本发明第五方面所述的组合物或本发明第六方面所述的药盒的用途,用于制备用于提高精准基因编辑效率的试剂或试剂盒。
111.本发明第八方面提供了一种提高精准基因编辑效率的方法,包括步骤:
112.在本发明第一方面所述的融合蛋白或本发明第二方面所述的嵌合rna或本发明第三方面所述的基因编辑试剂或本发明第四方面所述的试剂盒或本发明第五方面所述组合物或本发明第六方面所述的药盒的存在下,对细胞进行基因编辑,从而提高精准基因编辑效率。
113.在另一优选例中,所述细胞包括人或非人哺乳动物细胞(如灵长类动物、小鼠、大鼠或家畜)或植物细胞。
114.在另一优选例中,所述细胞包括癌细胞或正常细胞。
115.在另一优选例中,所述细胞选自下组:小鼠脑神经瘤细胞、人胚胎肾细胞、或人宫颈癌细胞、人结肠癌细胞、人骨肉瘤细胞、肾脏细胞、肝脏细胞、神经细胞、心脏细胞、上皮细胞、肌细胞、体细胞、骨髓细胞、内皮细胞、或其组合。在另一优选例中,所述细胞选自下组:293细胞、a549细胞、sw626细胞、ht-3细胞、pa-1细胞、n2a细胞、hela细胞、hct116细胞、u2os细胞、或其组合。
116.在另一优选例中,所述细胞包括n2a细胞、hek293ft细胞、hela细胞、hct116细胞、或u2os细胞。
117.在另一优选例中,所述的基因编辑在一体外反应体系中进行。
118.在另一优选例中,所述方法为非诊断性和非性的。
119.在另一优选例中,所述细胞为体外的细胞。
120.应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在此不再一一累述。
附图说明
121.图1显示为反转录子对ncrna进行反转录产生供体msdna的示意图。
122.图2显示为四种反转录子/ncrna分别与cas9/grna进行融合构建新型基因编辑系统的示意图。
123.图3显示为基于四种反转录子的编辑系统产生的msdna的丰度检测。
124.图4显示为对人类emx1和hek3基因的靶点序列设计示意图。
125.图5显示为融合蛋白和嵌合rna的构建方式示意图。
126.图6显示为四种反转录子和cas9构建的基因编辑系统之间的编辑效率比较。
127.图7显示为基于ec73反转录子的基因编辑系统和基于失活型ec73反转录子的基因编辑系统之间的效率比较。
具体实施方式
128.本发明人经过广泛而深入地研究,通过大量筛选,意外地获得一种融合蛋白和嵌合rna。本发明的融合蛋白和嵌合rna可实现任意碱基替换的精准基因编辑,并且可显著提高精准基因编辑效率,并且精准基因编辑效率可达近10%。在此基础上,本发明人完成了本发明。
129.术语
130.为了可以更容易地理解本公开,首先定义某些术语。如本技术中所使用的,除非本文另有明确规定,否则以下术语中的每一个应具有下面给出的含义。在整个申请中阐述了其它定义。
131.术语“约”可以是指在本领域普通技术人员确定的特定值或组成的可接受误差范围内的值或组成,其将部分地取决于如何测量或测定值或组成。例如,如本文所用,表述“约100”包括99和101和之间的全部值(例如,99.1、99.2、99.3、99.4等)。
132.如本文所用,术语“含有”或“包括(包含)”可以是开放式、半封闭式和封闭式的。换言之,所述术语也包括“基本上由

构成”、或“由

构成”。
133.序列同一性(或同源性)通过沿着预定的比较窗(其可以是参考核苷酸序列或蛋白的长度的50%、60%、70%、80%、90%、95%或100%)比较两个对齐的序列,并且确定出现相同的残基的位置的数目来确定。通常地,这表示为百分比。核苷酸序列的序列同一性的测量是本领域技术人员熟知的方法。
134.基因编辑蛋白
135.在本发明中,基因编辑蛋白的核苷酸可以通过基因工程技术来获得,如基因组测序、聚合酶链式反应(pcr)等,其氨基酸序列可由核苷酸序列推导而得到。所述野生型的基因编辑蛋白的来源包括(但并不限于):黄化瘤胃球菌(ruminococcus flavefaciens)、酿脓链球菌(streptococcus pyogenes)、葡萄球菌(staphylococcus aureus)、氨基酸球菌属(acidaminococcus sp)、毛螺科菌(lachnospiraceae bacterium)。
136.在本发明的一个优选例中,所述基因编辑蛋白包括,但并不限于cas9、cas12a和cas12b。
137.反转录子
138.retrons(反转录子)是编码逆转录酶的独特dna序列,与逆转录病毒产生的逆转录
酶类似。反转录子包含反转录酶和ncrna两部分。retron广泛存在于多种不同的细菌基因组中,通常与原噬菌体dna相关。retron由约2kb的独特dna组成,retron dna编码的启动子序列调控由三个位点组成的简单操纵子(msr、msd和ret)的转录。
139.嵌合rna
140.本发明首次将反转录子的非编码rna(ncrna)以特定的顺序与引导基因编辑蛋白特异性结合靶标核酸分子的rna的grna连接(即ncrna在5’端,grna在3’端,意外的发现,本发明的嵌合rna可实现任意碱基替换的精准基因编辑,并且可提高精准基因编辑效率。
141.融合蛋白
142.如本文所用,“本发明融合蛋白”、或“多肽”均指本发明第一方面所述的融合蛋白。本发明融合蛋白的结构如下式i或i’所示:
143.a-l-b
ꢀꢀꢀ(i)144.b-l-a
ꢀꢀꢀ
(i’)
145.式中,
146.a为基因编辑蛋白,
147.b为反转录酶,所述反转录酶选自下组:ec73、ec107、或其组合。
148.l为无或连接肽,
149.各
“‑”
独立地为连接肽或肽键或非肽键。
150.在本发明中,连接肽的长度对融合蛋白的活性有影响,优选的连接肽的长度为1-100aa,较佳地,10-85aa,更佳地,15-70aa。一种优选的连接肽如seq id no.:1所示。
151.如本文所用,术语“融合蛋白”还包括具有上述活性的、seq id no.:6或7所示的变异形式。这些变异形式包括(但并不限于):1-3个(通常为1-2个,更佳地1个)氨基酸的缺失、插入和/或取代,以及在c末端和/或n末端添加或缺失一个或数个(通常为3个以内,较佳地为2个以内,更佳地为1个以内)氨基酸。例如,在本领域中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在c末端和/或n末端添加或缺失一个或数个氨基酸通常也不会改变蛋白质的结构和功能。此外,所述术语还包括单体和多聚体形式的本发明多肽。该术语还包括线性以及非线性的多肽(如环肽)。
152.本发明还包括上述融合蛋白的活性片段、衍生物和类似物。如本文所用,术语“片段”、“衍生物”和“类似物”是指基本上保持本发明融合蛋白的功能或活性的多肽。本发明的多肽片段、衍生物或类似物可以是(i)有一个或几个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽,或(ii)在一个或多个氨基酸残基中具有取代基团的多肽,或(iii)抗原肽与另一个化合物(比如延长多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(iv)附加的氨基酸序列融合于此多肽序列而形成的多肽(与前导序列、分泌序列或6his等标签序列融合而形成的融合蛋白)。根据本文的教导,这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。
153.一类优选的活性衍生物指与式i或i’的氨基酸序列相比,有至多3个,较佳地至多2个,更佳地至多1个氨基酸被性质相似或相近的氨基酸所替换而形成多肽。这些保守性变异多肽最好根据表a进行氨基酸替换而产生。
154.表a
[0155][0156][0157]
本发明还提供本发明融合蛋白的类似物。这些类似物与seq id no.:6或7所示的多肽的差别可以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。类似物还包括具有不同于天然l-氨基酸的残基(如d-氨基酸)的类似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的类似物。应理解,本发明的多肽并不限于上述例举的代表性的多肽。
[0158]
修饰(通常不改变一级结构)形式包括:体内或体外的多肽的化学衍生形式如乙酰化或羧基化。修饰还包括糖基化,如那些在多肽的合成和加工中或进一步加工步骤中进行糖基化修饰而产生的多肽。这种修饰可以通过将多肽暴露于进行糖基化的酶(如哺乳动物的糖基化酶或去糖基化酶)而完成。修饰形式还包括具有磷酸化氨基酸残基(如磷酸酪氨酸,磷酸丝氨酸,磷酸苏氨酸)的序列。还包括被修饰从而提高了其抗蛋白水解性能或优化了溶解性能的多肽。
[0159]
在一优选实施方式中,本发明的融合蛋白的氨基酸序列如seq id no.:6或7所示。
[0160]
腺相关病毒
[0161]
因腺相关病毒(adeno-associated virus,aav)较其他病毒载体小,无致病性,可转染正在分裂和未分裂的细胞等特性,基于aav载体的针对遗传性疾病的基因方法受到了广泛的关注。
[0162]
腺相关病毒(adeno-associated virus,aav),也称腺伴随病毒,属于微小病毒科依赖病毒属,是目前发现的一类结构最简单的单链dna缺陷型病毒,需要辅助病毒(通常为腺病毒)参与复制。它编码两个末端的反向重复序列(itr)中的cap和rep基因。itrs对于病
毒的复制和包装具有决定性作用。cap基因编码病毒衣壳蛋白,rep基因参与病毒的复制和整合。aav能感染多种细胞。
[0163]
重组腺相关病毒载体(raav)源于非致病的野生型腺相关病毒,由于其安全性好、宿主细胞范围广(分裂和非分裂细胞)、免疫源性低,在体内表达外源基因时间长等特点,被视为最有前途的基因转移载体之一,在世界范围内的基因和疫苗研究中得到广泛应用。经过10余年的研究,重组腺相关病毒的生物学特性己被深入了解,尤其是其在各种细胞、组织和体内实验中的应用效果方面已经积累了许多资料。在医学研究中,raav被用于多种疾病的基因的研究(包括体内、体外实验);同时作为一种有特点的基因转移载体,还广泛用于基因功能研究、构建疾病模型、制备基因敲除鼠等方面。
[0164]
在本发明一个优选的实施例中,载体为重组aav载体。aav是相对较小的dna病毒,其可以稳定和位点特异性方式整合到它们所感染的细胞的基因组中。它们能够感染一大系列的细胞而不对细胞生长、形态或分化产生任何影响,并且它们似乎并不涉及人体病理学。aav基因组己被克隆、测序及表征。aav在每个末端包含约145个碱基的反向末端重复序列(itr)区域,其作为病毒的复制起点。该基因组的其余被分成两个带有衣壳化功能的重要区域:包含涉及病毒复制和病毒基因表达的rep基因的基因组左边部分;以及包含编码病毒衣壳蛋白的cap基因的基因组右边部分。
[0165]
aav载体可采用本领域的标准方法制备。任何血清型的腺相关病毒均是合适的。用于纯化载体的方法可见于例如美国专利no.6566118、6989264和6995006,它们的公开内容整体以引用方式并入本文。杂合载体的制备在例如pct申请no.pct/us2005/027091中有所描述,该申请的公开内容整体以引用方式并入本文。用于体外和体内转运基因的衍生自aav的载体的使用己有描述(参见例如国际专利申请公布no.wo91/18088和wo93/09239;美国专利no.4,797,368、6,596,535和5,139,941,以及欧洲专利no.0488528,它们均整体以引用方式并入本文)。这些专利公布描述了其中rep和/或cap基因缺失并被所关注的基因替换的各种来源于aav的构建体,以及这些构建体在体外(进入培养的细胞中)或体内(直接进入生物体)转运所关注的基因的用途。复制缺陷重组aav可通过将以下质粒共转染进被人类辅助病毒(例如腺病毒)感染的细胞系而制备:所含的所关注核酸序列的侧翼为两个aav反向末端重复序列(itr)区域的质粒,和携带aav衣壳化基因(rep和cap基因)的质粒。然后通过标准技术纯化所产生的aav重组体。
[0166]
在一些实施方案中,重组载体被衣壳化到病毒粒子(例如包括但不限于aav1、aav2、aav3、aav4、aav5、aav6、aav7、aav8、aav9、aav10、aav11、aav12、aav13、aav14、aav15和aav16的aav病毒粒子)中。因此,本公开包括含有本文所述的任何载体的重组病毒粒子(因其包含重组多核苷酸而为重组的)。产生这样的粒子的方法是本领域己知的,并在美国专利no.6,596,535中有所描述。
[0167]
表达载体和宿主细胞
[0168]
本发明也涉及包含本发明的多核苷酸的载体,以及用本发明的载体或本发明融合蛋白编码序列经基因工程产生的宿主细胞,以及经重组技术产生本发明所述多肽的方法。
[0169]
通过常规的重组dna技术,可利用本发明的多聚核苷酸序列可用来表达或生产重组的融合蛋白。一般来说有以下步骤:
[0170]
(1).用本发明的编码本发明融合蛋白的多核苷酸(或变异体),或用含有该多核苷
酸的重组表达载体转化或转导合适的宿主细胞;
[0171]
(2).在合适的培养基中培养的宿主细胞;
[0172]
(3).从培养基或细胞中分离、纯化蛋白质。
[0173]
本发明中,编码融合蛋白的多核苷酸序列可插入到重组表达载体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其他载体。只要能在宿主体内复制和稳定,任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。
[0174]
本领域的技术人员熟知的方法能用于构建含本发明融合蛋白编码dna序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组dna技术、dna合成技术、体内重组技术等。所述的dna序列可有效连接到表达载体中的适当启动子上,以指导mrna合成。这些启动子的代表性例子有:大肠杆菌的lac或trp启动子;λ噬菌体pl启动子;真核启动子包括cmv立即早期启动子、hsv胸苷激酶启动子、早期和晚期sv40启动子、反转录病毒的ltrs和其他一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。
[0175]
此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状,如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿荧光蛋白(gfp),或用于大肠杆菌的四环素或氨苄青霉素抗性。
[0176]
包含上述的适当dna序列以及适当启动子或者控制序列的载体,可以用于转化适当的宿主细胞,以使其能够表达蛋白质。
[0177]
宿主细胞可以是原核细胞(如大肠杆菌),或是低等真核细胞,或是高等真核细胞,如酵母细胞、植物细胞或哺乳动物细胞(包括人和非人哺乳动物)。代表性例子有:大肠杆菌、麦胚细胞,昆虫细胞,sf9、hela、hek293、cho、酵母细胞等。在本发明的一个优选实施方式中,选择酵母细胞(如毕氏酵母、克鲁维酵母、或其组合;较佳地,所述的酵母细胞包括:克鲁维酵母,更佳地为马克斯克鲁维酵母、和/或乳酸克鲁维酵母)为宿主细胞。
[0178]
本发明的多核苷酸在高等真核细胞中表达时,如果在载体中插入增强子序列时将会使转录得到增强。增强子是dna的顺式作用因子,通常大约有10到300个碱基对,作用于启动子以增强基因的转录。可举的例子包括在复制起始点晚期一侧的100到270个碱基对的sv40增强子、在复制起始点晚期一侧的多瘤增强子以及腺病毒增强子等。
[0179]
本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞。
[0180]
用重组dna转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时,能吸收dna的感受态细胞可在指数生长期后收获,用cacl2法处理,所用的步骤在本领域众所周知。另一种方法是使用mgcl2。如果需要,转化也可用电穿孔的方法进行。当宿主是真核生物,可选用如下的dna转染方法:磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。
[0181]
获得的转化子可以用常规方法培养,表达本发明的基因所编码的多肽。根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)诱导选择的启动子,将细胞再培养一段时间。
[0182]
在上面的方法中的重组多肽可在细胞内、或在细胞膜上表达、或分泌到细胞外。如
果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于:常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(hplc)和其它各种液相层析技术及这些方法的结合。
[0183]
本发明的主要优点包括:
[0184]
(1)本发明首次发现,本发明的融合蛋白和嵌合rna可实现任意碱基替换的精准基因编辑,并且可提高精准基因编辑效率,最高编辑效率可达近10%。
[0185]
(2)本发明首次提供了一种高效的新型编辑工具,其通过在cas9对目标位点进行切割的同时,利用反转录子在目标位点附近对嵌合rna进行反转录产生大量供体dna模板,从而实现目标位点的高效同源重组。相比于传统的同源重组方法,本发明不需要额外递送dna进入细胞,因此具有更好的应用前景。
[0186]
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如sambrook等人,分子克隆:实验室手册(new york:cold spring harbor laboratory press,1989)中所述的条件,或按照制造厂商所建议的条件。除非另外说明,否则百分比和份数按重量计算。本发明中所涉及的实验材料和试剂如无特殊说明均可从市售渠道获得。
[0187]
实施例1:筛选可在真核细胞中逆转录产生多拷贝单链dna(msdna)的反转录子
[0188]
反转录子由反转录酶rt和ncrna构成,反转录酶通过将ncrna作为模板可反转录产生ssdna(图1)。我们选用了四种已被体外实验证明具有逆转录活性的反转录子(ec48、ec73、ec86、ec107),用xten连接肽段(seq id no.1)将反转录子ec48、ec73、ec86、ec107的反转录酶连接于cas9蛋白(seq id no.2)的氨基端和羧基端(ec48rt-cas9,ec73rt-cas9,ec86rt-cas9,ec107rt-cas9,cas9-ec48rt,cas9-ec73rt,cas9-ec86rt,cas9-ec107rt)。其中,ec73和ec107的氨基酸序列分别为seq id no.3和seq id no.4。我们在融合蛋白的n端和c端添加了核定位信号nls(seq id no.5),最终得到了nls-ec73_rt-xten-cas9-nls(seq id no.6)和nls-ec107_rt-xten-cas9-nls(seq id no.7)。我们构建了rt-xten-cas9融合蛋白的表达载体,并在该载体中插入bfp蛋白的表达序列用于后续细胞分选(图2所示)。我们人工合成了反转录子ec48、ec73、ec86、ec107的非编码rna。其中ec73和ec107的非编码rna序列分别如seq id no.8和seq id no.9所示。另外,我们在反转录子ec48、ec73、ec86、ec107的非编码rna的可替换区域插入两个ecori核酸内切酶酶切位点,并将这些非编码rna连接于crispr-cas9 grna(骨架grna,seq id no.10)的5’端和3’端,构建了我们称之为反转录子非编码rna-grna(rgrna)的表达载体,并在该载体中插入mcherry蛋白的表达序列用于后续细胞分选。其中,ec73和ec107的嵌合rna序列为seq id no.11和seq id no.12.
[0189]
根据常用的哺乳动物细胞培养方法,将人hek293t细胞在24孔细胞培养皿中培养,在细胞密度达到合适程度将上述rt-xten-cas9融合蛋白和rgrna表达载体通过pei转染试剂进行细胞转染,转染后的细胞在5%co2的37℃细胞培养箱中培养72小时,随后利用流式细胞分选技术分选收集bfp和mcherry双阳性细胞。对上述收集的双阳性细胞进行rna抽提,随后进行实时荧光定量pcr,检测msdna的丰度(图3所示)。
[0190]
实施例2:筛选可用于真核细胞基因组编辑的反转录子
[0191]
为了获得可应用于真核细胞基因组编辑的反转录子,我们选择了人类的emx1和
hek3基因进行靶点设计(图4所示)。我们选用了四种已被体外实验证明具有逆转录活性的反转录子(ec48、ec73、ec86、ec107),将反转录子ec48、ec73、ec86、ec107的反转录酶连接于cas9蛋白的氨基端和羧基端,并在反转录酶和cas9中间用xten肽链连接,构建了rt-xten-cas9融合蛋白的表达载体(ec48rt-cas9,ec73rt-cas9,ec86rt-cas9,ec107rt-cas9,cas9-ec48rt,cas9-ec73rt,cas9-ec86rt,cas9-ec107rt),并在该载体中插入bfp蛋白的表达序列用于后续细胞分选(图5所示)。另外,我们在反转录子ec48、ec73、ec86、ec107的非编码rna的可替换区域插入两个ecori核酸内切酶酶切位点,并将这些非编码rna连接于crispr-cas9 grna的5’端和3’端,构建了我们称之为反转录子非编码rna-grna(rgrna)的表达载体,并在该载体中插入mcherry蛋白的表达序列用于后续细胞分选。随后,我们将靶向人emx1基因组位点和人hek3基因组位点的grna序列和用作反转录酶反转录模板的emx1和hek3修饰序列连接进rgrna表达载体上,构建载体:5’ec48 rgrna_emx1、3’ec48 rgrna_emx1、5’ec73 rgrna_emx1、3’ec73 rgrna_emx1、5’ec86 rgrna_emx1、3’ec86 rgrna_emx1、5’ec107 rgrna_emx1、3’ec107 rgrna_emx1、5’ec48 rgrna_hek3、3’ec48 rgrna_hek3、5’ec73 rgrna_hek3、3’ec73 rgrna_hel3、5’ec86 rgrna_hek3、3’ec86 rgrna_hek3、5’ec107 rgrna_hek3、3’ec107 rgrna_hek3
[0192]
grna_emx1的向导序列:gagtccgagcagaagaagaa(seq id no.13)
[0193]
grna_hek3的向导序列:ggcccagactgagcacgtga(seq id no.14)
[0194]
emx1修饰序列(靶基因序列):
[0195]
acaaacggcagaagctggaggaggaagggcctgagtccgagcagaagaagcttaagggctcccatcacatcaaccggtggcgcattgccacgaagcaggccaatggggaggacatcgatgtca(seq id no.15)hek3修饰序列(靶基因序列):
[0196]
gcttctccagccctggcctgggtcaatccttggggcccagactgagcactagtgatggcagaggaaaggaagccctgcttcctccagagggcgtcgcaggacagcttttcctagacaggggc(seq id no.16)
[0197]
根据常用的哺乳动物细胞培养方法,将人hek293t细胞在24孔细胞培养皿中培养,在细胞密度达到合适程度将上述ec48rt-cas9,ec73rt-cas9,ec86rt-cas9,ec107rt-cas9,cas9-ec48rt,cas9-ec73rt,cas9-ec86rt,cas9-ec107rt融合蛋白和5’ec48 rgrna_emx1、3’ec48 rgrna_emx1、5’ec73 rgrna_emx1、3’ec73 rgrna_emx1、5’ec86 rgrna_emx1、3’ec86 rgrna_emx1、5’ec107 rgrna_emx1、3’ec107 rgrna_emx1、5’ec48 rgrna_hek3、3’ec48 rgrna_hek3、5’ec73 rgrna_hek3、3’ec73 rgrna_hel3、5’ec86 rgrna_hek3、3’ec86 rgrna_hek3、5’ec107 rgrna_hek3、3’ec107 rgrna_hek3
[0198]
表达载体分别两两组合通过pei转染试剂进行细胞共转染,转染后的细胞在5%co2的37℃细胞培养箱中培养72小时,随后利用流式细胞分选技术分选收集bfp和mcherry双阳性细胞。对上述收集的双阳性细胞进行基因组dna的抽提,在分被对应扩增emx1和hek3基因组位点,构建到平末端载体中进行单克隆sanger测序,统计检测精准基因编辑的效率。结果表明,ec73和ec107可用于真核细胞基因组编辑。我们发现ec73在两个靶位点都有将近10%的编辑效率(图6所示)。
[0199]
进一步,我们为了排除质粒模板对同源重组的影响,我们比较了基于野生的ec73和失活的ec73的retron编辑系统,发现在ec73失活的情况下,同源重组效率效率小于1%。因此我们认为反转录子对同源重组起关键作用(图7所示)。
[0200]
对比例
[0201]
用本发明的方法,区别在于,使用其他的反转录酶(比如ec86,ec48)与cas9构建融合蛋白,结果表明,实现精准基因编辑效率小于1%。
[0202]
序列信息:
[0203]
seq id no.1:sggssggssgsetpgtsesatpessggssggs
[0204]
seq id no.2:dkkysigldigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdli iklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd
[0205]
seq id no.3:sriyslidsqtlmtkgfasevmrspeppkkwdiakkkggmrtiyhpsskvkliqywlmnnvfsklpmhnaayafvknrsiksnallhaesknkyyvkidlkdffpsikftdfeyaftryrdrieftteydkellqlikticfisdstlpigfptsplianfvareldekltqklnaidklnatytryaddiivstnmkgasklildcfkrtmkeigpdfkinikkfkicsasggsivvtglkvchdfhitlhrsmkdkirlhlsllskgilkdedhnklsgyiayakdidphfytklnrkyfqeikwiqnlhnkvesggskrtadgsefe
[0206]
seq id no.4:sdatrttllaldlfgspgwsadkeiqrlhalsnhagrhyrri ilskrhggqrlvlapdyllktvqrnilknvlsqfplspfatayrpgcpivsnaqphcqqpqilkldienffdsiswlqvwrvfrqaqlprnvvtmltwiccyndalpqgaptspaisnlvmrrfderigewcqargitytrycddmtfsghfnarqvknkvcgllaelglslnkrkgcliaackrqqvtgivvnhkpqlarearralrqevhlcqkygvishlshrgeldpsgdlhaqataylyalqgrinwllqinpedeafqqaresvkrmlvawsggskrtadgsefe
[0207]
seq id no.5:pkkkrkv
[0208]
seq id no.6:mapkkkrkvgihgvpaadkkys igldigtnsvgwavitdeykvpskkfkvlgntdrhs ikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklql
skdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllki ikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldei ieqisefskrviladanldkvlsaynkhrdkpireqaeni ihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggdsggssggssgsetpgtsesatpessggssggssriyslidsqtlmtkgfasevmrspeppkkwdiakkkggmrtiyhpsskvkliqywlmnnvfsklpmhnaayafvknrsiksnallhaesknkyyvkidlkdffpsikftdfeyaftryrdrieftteydkellqlikticfisdstlpigfptsplianfvareldekltqklnaidklnatytryaddi ivstnmkgasklildcfkrtmkeigpdfkinikkfkicsasggs ivvtglkvchdfhitlhrsmkdkirlhlsllskgilkdedhnklsgyiayakdidphfytklnrkyfqeikwiqnlhnkvesggskrtadgsefepkkkrkv*
[0209]
seq id no.7:mapkkkrkvgihgvpaadkkys igldigtnsvgwavitdeykvpskkfkvlgntdrhs ikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllki ikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdli iklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldei ieqisefskrviladanldkvlsaynkhrdkpireqaeni ihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggdsggssggssgsetpgtsesatpessggssggssd
atrttllaldlfgspgwsadkeiqrlhalsnhagrhyrriilskrhggqrlvlapdyllktvqrnilknvlsqfplspfatayrpgcpivsnaqphcqqpqilkldienffdsiswlqvwrvfrqaqlprnvvtmltwiccyndalpqgaptspaisnlvmrrfderigewcqargitytrycddmtfsghfnarqvknkvcgllaelglslnkrkgcliaackrqqvtgivvnhkpqlarearralrqevhlcqkygvishlshrgeldpsgdlhaqataylyalqgrinwllqinpedeafqqaresvkrmlvawsggskrtadgsefepkkkrkv*
[0210]
seq id no.8:gcagagccaaacctagcattttatgggttaatagcccatcgggccatgagtcatggtttcgcctagt attttagctatgcccgtcgtt[供体dna(dna donor)]atcgacgtgctcaagtaggtttggctct
[0211]
seq id no.9:cgccagcagtggcaatagcgtttccggccttttgtgccgggagggtcggcgagtcgctgacttaacgccagtagtatgtccat[供体dna(dna donor)]atggtttaatggtattgccgctgttggcgseq id no.10:gttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgc
[0212]
seq id no.11:gttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcgcagagccaaacctagcattttatgggttaatagcccatcgggccatgagtcatggtttcgcctagtattttagctatgcccgtcgtt[供体dna(dna donor)]atcgacgtgctcaagtaggtttggctct
[0213]
seq id no.12:gttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgccgccagcagtggcaatagcgtttccggccttttgtgccgggagggtcggcgagtcgctgacttaacgccagtagtatgtccat[供体dna(dna donor)]atggtttaatggtattgccgctgttggcg
[0214]
在本发明提及的所有文献都在本技术中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本技术所附权利要求书所限定的范围。

技术特征:


1.一种融合蛋白,其特征在于,所述融合蛋白的结构如下式i或i’所示:a-l-b
ꢀꢀꢀ
(i)b-l-a
ꢀꢀꢀ
(i’)式中,a为基因编辑蛋白,b为反转录酶,所述反转录酶选自下组:ec73、ec107、或其组合。l为无或连接肽,各
“‑”
独立地为连接肽或肽键或非肽键。2.如权利要求1所述的融合蛋白,其特征在于,所述基因编辑蛋白选自下组:cas9、cas12a、cas12b、或其组合。3.如权利要求1所述的融合蛋白,其特征在于,所述基因编辑蛋白选自下组:酿脓链球菌(streptococcus pyogenes)、葡萄球菌(staphylococcus aureus)、氨基酸球菌属(acidaminococcus sp)、毛螺科菌(lachnospiraceae bacterium)、或其组合。4.一种嵌合rna,其特征在于,所述嵌合rna具有式ii所示的结构:c-z-d
ꢀꢀꢀ
(ii)式中,c为反转录子的非编码rna(ncrna),所述反转录子选自下组:ec73、ec107、或其组合;z为无或接头序列(linker);d为grna,所述grna引导基因编辑蛋白特异性结合靶标核酸分子的rna;各
“‑”
独立地为键或核苷酸连接序列。5.一种基因编辑试剂,其特征在于,包括:(a)权利要求1所述的融合蛋白、或其编码基因或其表达载体;和(b)权利要求4所述的嵌合rna或其表达载体。6.一种试剂盒,其特征在于,所述试剂盒包括权利要求5所述的基因编辑试剂。7.一种组合物,其特征在于,包括:(a)权利要求1所述的融合蛋白、或其编码基因或其表达载体;和(b)权利要求4所述的嵌合rna或其表达载体。8.一种药盒,其特征在于,包括:(a1)第一容器,以及位于所述第一容器中的权利要求1所述的融合蛋白、或其编码基因或其表达载体,或含有权利要求1所述的融合蛋白、或其编码基因或其表达载体的药物;(b1)第二容器,以及位于所述第二容器中的权利要求4所述的嵌合rna或其表达载体,或含有权利要求4所述的嵌合rna或其表达载体的药物。9.一种权利要求1所述的融合蛋白、权利要求4所述嵌合rna、权利要求5所述的基因编辑试剂或权利要求7所述的组合物或权利要求8所述的药盒的用途,其特征在于,用于制备用于提高精准基因编辑效率的试剂或试剂盒。10.一种提高精准基因编辑效率的方法,其特征在于,包括步骤:在权利要求1所述的融合蛋白或权利要求4所述的嵌合rna或权利要求5所述的基因编辑试剂或权利要求6所述的试剂盒或权利要求7所述组合物或权利要求8所述的药盒的存在下,对细胞进行基因编辑,从而提高精准基因编辑效率。

技术总结


本发明提供了一种CRISPR与反转录子的组合物系统及用途,具体地,本发明提供一种融合蛋白和嵌合RNA,本发明的融合蛋白和嵌合RNA可显著提高细胞的基因编辑效率。显著提高细胞的基因编辑效率。


技术研发人员:

杨辉 汪子康

受保护的技术使用者:

中国科学院脑科学与智能技术卓越创新中心

技术研发日:

2021.08.19

技术公布日:

2023/2/20

本文发布于:2024-09-22 19:44:36,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/54041.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:所述   序列   基因   细胞
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议