与硫胺类似物和衍生物结合的适体的制作方法

与硫胺类似物和衍生物结合的适体1.相关申请的交叉引用2.本技术要求2020年3月24日提交的美国申请第62/994,135号的优先权,所述申以引用方式整体并入本文中。3.领域4.本公开涉及与某些小分子结合的寡核苷酸适体和产生与小分子结合的适体的方法。还考虑了用于调节靶基因的表达的核糖开关和多核苷酸盒,其中多核苷酸盒包含本文公开的适体。进一步提供了作为靶基因表达的调节剂的小分子,其中靶基因含有包含本文所述适体的核糖开关。技术背景5.适体是以高亲和力和特异性与靶配体结合的寡核苷酸。这些核酸序列已被证明具有高和诊断价值,最近fda批准了第一种适体药物和临床管道中的其它药物。它们的高度特异性和多功能性使rna适体成为新兴rna纳米

技术领域


:对抗人类疾病,包括癌症、病毒感染和其它疾病的关键工具之一。6.另外,适体可用作在适体配体存在或不存在时具有某些作用的核糖开关的一部分。例如,核糖开关可用于响应适体配体的存在或不存在而调节基因表达。7.然而,衍生自原核来源或使用体外选择方法生成的适体通常无法证明在真核系统中表达靶基因所需的功能。因此,需要能够响应小分子配体的存在或不存在而调节基因表达的新型适体序列。技术实现要素:8.本文提供了与小分子,例如焦磷酸硫胺(tpp)和其类似物或衍生物结合的适体序列。还考虑了用于调节靶基因的表达的核糖开关和多核苷酸盒,其中多核苷酸盒包含本文公开的适体。进一步提供了使用所述适体、核糖开关和/或多核苷酸盒来调节靶基因,包括基因的方法。本文还提供了作为靶基因表达的调节剂的小分子,其中所述靶基因含有包含本文所述的适体的核糖开关。9.在一个方面,提供了一种用于调节靶基因的表达的多核苷酸盒,其中所述多核苷酸盒包含编码与小分子结合的适体的序列,其中所述适体编码序列包含:10.acx1ggggtccggcx2tx3ttcatttggcx4ccggtgagax5x6ax7acccttx8x9x10x11cctgttx12acggataatgccgcx13gcagggagt(seqidno:1),11.其中12.x1是a或g;13.x2是c或无核苷酸;14.x3是t或无核苷酸;15.x4是a或g;16.x5是任何核苷酸;17.x6是任何核苷酸;18.x7是任何核苷酸;19.x8是任何核苷酸;20.x9是c、g或t;21.x10是任何核苷酸;22.x11是a或t;23.x12是c或t;且24.x13是c或t。25.在一个方面,提供了一种用于调节靶基因的表达的多核苷酸盒,其中所述多核苷酸盒包含编码与小分子结合的适体的序列,其中所述适体编码序列包含26.acx1ggggtccggcx2tx3ttcatttggcgccggtgagax5x6ax7acccttx8x9x10x11cctgttx12acggataatgccgcx13gcagggagt(seqidno:2),27.其中28.x1是a或g;29.x2是c或无核苷酸;30.x3是t或无核苷酸;31.x5是g或t;32.x6是c或t;33.x7是c或t;34.x8是任何核苷酸;35.x9是g或t;36.x10是a、g或t;37.x11是a或t;38.x12是c或t;且39.x13是c或t。40.在一个方面,提供了一种用于调节靶基因的表达的多核苷酸盒,其中所述多核苷酸盒包含编码与小分子结合的适体的序列,其中所述适体编码序列包含41.acaggggtccggccttttcatttggcgccggtgagagcacaccctttgaacctgttx12acggataatgccgcx13gcagggagt(seqidno:3),42.其中43.x12是c或t;且44.x13是c或t。45.在一个方面,提供了一种用于调节靶基因的表达的多核苷酸盒,其中所述多核苷酸盒包含编码与小分子结合的适体的序列,其中所述适体编码序列包含46.acx1ggggtccggccttttcatttggcgccggtgagagcacacccttx8x9x10x11cctgtttacggataatgccgccgcagggagt(seqidno:4),47.其中48.x1是a或g;49.x8是任何核苷酸;50.x9是g或t;51.x10是a、g或t;且52.x11是a或t。53.在一个方面,提供了一种用于调节靶基因的表达的多核苷酸盒,其中所述多核苷酸盒包含编码与小分子结合的适体的序列,其中所述适体编码序列包含54.acaggggtccggccttttcatttggcgccggtgagax5x6ax7accctttgaacctgtttacggataatgccgccgcagggagt(seqidno:5),55.其中56.x5是g或t;57.x6是c或t;且58.x7是c或t。59.在一个方面,提供了一种用于调节靶基因的表达的多核苷酸盒,其中所述多核苷酸盒包含编码与小分子结合的适体的序列,其中所述适体编码序列包含60.acaggggtccggccttttcatttggcx4ccggtgagax5x6ax7acccttx8x9x10acctgttcacggataatgccgctgcagggagt(seqidno:6),61.其中62.x4是a或g;63.x5是任何核苷酸;64.x6是任何核苷酸;65.x7是任何核苷酸;66.x8是任何核苷酸;67.x9是c或g;且68.x10是任何核苷酸。69.在一个方面,提供了一种用于调节靶基因的表达的多核苷酸盒,其中所述多核苷酸盒包含编码与小分子结合的适体的序列,其中所述适体编码序列包含与选自由seqidno:7-36组成的组的序列(见表1)至少95%同一的序列。在一个方面,提供了一种用于调节靶基因的表达的多核苷酸盒,其中所述多核苷酸盒包含编码与小分子结合的适体的序列,其中所述适体编码序列包含选自由seqidno:7-36组成的组的序列(见表1)。70.在一个方面,提供了一种用于调节靶基因的表达的多核苷酸盒,其中所述多核苷酸盒包含编码与小分子结合的适体的序列,其中所述适体编码序列包含与选自由seqidno:8、9、14-18、21、25、26和30组成的组的序列至少95%同一的序列。在一个方面,提供了一种用于调节靶基因的表达的多核苷酸盒,其中所述多核苷酸盒包含编码与小分子结合的适体的序列,其中所述适体编码序列包含选自由seqidno:8、9、14-18、21、25、26和30组成的组的序列。71.在优选所述方案中,提供了一种用于调节靶基因的表达的多核苷酸盒,其中所述多核苷酸盒包含编码与小分子结合的适体的序列,其中所述适体编码序列包含与选自由seqidno:9、14和26组成的组的序列至少95%同一的序列。在更优选所述方案中,提供了一种用于调节靶基因的表达的多核苷酸盒,其中所述多核苷酸盒包含编码与小分子结合的适体的序列,其中所述适体编码序列包含选自由seqidno:9、14和26组成的组的序列。72.在一个方面,提供了编码与小分子结合的适体的序列,其中所述适体编码序列包含:73.acx1ggggtccggcx2tx3ttcatttggcx4ccggtgagax5x6ax7acccttx8x9x10x11cctgttx12acggataatgccgcx13gcagggagt(seqidno:1),74.其中75.x1是a或g;76.x2是c或无核苷酸;77.x3是t或无核苷酸;78.x4是a或g;79.x5是任何核苷酸;80.x6是任何核苷酸;81.x7是任何核苷酸;82.x8是任何核苷酸;83.x9是c、g或t;84.x10是任何核苷酸;85.x11是a或t;86.x12是c或t;且87.x13是c或t。88.在实施方案中,适体编码序列具有以下特性中的一种或多种:x1不是a;x2不是c;x3不是t;x4不是g;x5不是g;x6不是c;x7不是c;x8不是t;x9不是g;x10不是a;x11不是a;x12不是t;以及x13不是c。89.在实施方案中,以下所有者不同时存在于适体编码序列中:x1是a;x2是c;x3是t;x4是g;x5是g;x6是c;x7是c;x8是t;x9是g;x10是a;x11是a;x12是t;以及x13是c。90.在一个方面,提供了编码与小分子结合的适体的序列,其中所述适体编码序列包含:91.acx1ggggtccggcx2tx3ttcatttggcgccggtgagax5x6ax7acccttx8x9x10x11cctgttx12acggataatgccgcx13gcagggagt(seqidno:2),92.其中93.x1是a或g;94.x2是c或无核苷酸;95.x3是t或无核苷酸;96.x5是g或t;97.x6是c或t;98.x7是c或t;99.x8是任何核苷酸;100.x9是g或t;101.x10是a、g或t;102.x11是a或t;103.x12是c或t;且104.x13是c或t。105.在实施方案中,适体编码序列具有以下特性中的一种或多种:x1不是a;x2不是c;x3不是t;x4不是g;x5不是g;x6不是c;x7不是c;x8不是t;x9不是g;x10不是a;x11不是a;x12不是t;以及x13不是c。在实施方案中,以下所有者不同时存在于适体编码序列中:x1是a;x2是c;x3是t;x5是g;x6是c;x7是c;x8是t;x9是g;x10是a;x11是a;x12是t;以及x13是c。106.在一个方面,提供了编码与小分子结合的适体的序列,其中所述适体编码序列包含:107.acaggggtccggccttttcatttggcgccggtgagagcacaccctttgaacctgttx12acggataatgccgcx13gcagggagt(seqidno:3),108.其中109.x12是c或t;且110.x13是c或t。111.在实施方案中,适体编码序列具有以下特性中的一种或多种:x12不是t;以及x13不是c。在实施方案中,以下所有者不同时存在于适体编码序列中:x12是t以及x13是c。112.在一个方面,提供了编码与小分子结合的适体的序列,其中所述适体编码序列包含:113.acx1ggggtccggccttttcatttggcgccggtgagagcacacccttx8x9x10x11cctgtttacggataatgccgccgcagggagt(seqidno:4),114.其中115.x1是a或g;116.x8是任何核苷酸;117.x9是g或t;118.x10是a、g或t;且119.x11是a或t。120.在实施方案中,适体编码序列具有以下特性中的一种或多种:x1不是a;x8不是t;x9不是g;x10不是a;x11不是a。在实施方案中,以下所有者不同时存在于适体编码序列中:x1是a;x8是t;x9是g;x10是a;x11是a;x12是t;以及x13是c。121.在一个方面,提供了编码与小分子结合的适体的序列,其中所述适体编码序列包含:122.acaggggtccggccttttcatttggcgccggtgagax5x6ax7accctttgaacctgtttacggataatgccgccgcagggagt(seqidno:5),123.其中124.x5是g或t;125.x6是c或t;且126.x7是c或t。127.在实施方案中,适体编码序列具有以下特性中的一种或多种:x5不是g;x6不是c;以及x7不是c。在实施方案中,以下所有者不同时存在于适体编码序列中:x5是g;x6是c;以及x7是c。128.在一个方面,提供了编码与小分子结合的适体的序列,其中所述适体编码序列包含:129.acaggggtccggccttttcatttggcx4ccggtgagax5x6ax7acccttx8x9x10acctgttcacggataatgccgctgcagggagt(seqidno:6),130.其中131.x4是a或g;132.x5是任何核苷酸;133.x6是任何核苷酸;134.x7是任何核苷酸;135.x8是任何核苷酸;136.x9是c或g;且137.x10是任何核苷酸。138.在一个方面,提供了一种编码与小分子结合的适体的序列,其中所述适体编码序列包含与选自由seqidno:7-36组成的组的序列(见表1)至少95%同一的序列。在一些实施方案中,适体编码序列包含选自由以下组成的组的序列:seqidno:8、9、14-18、21、25、26和30。在一个实施方案中,适体编码序列包含选自由seqidno:9、14和26组成的组的序列。139.在一些实施方案中,适体与本文公开的小分子,包括具有根据式i-viii的结构的小分子结合或以其它方式响应所述小分子的存在。在实施方案中,小分子具有根据式i的结构:[0140][0141]其中:[0142]r1选自由以下组成的组:oh、氨基、f、cl、br、磷酸酯基、焦磷酸酯基、[0143]-o-c(=o)-c1-c6烷基、-o-c(=o)-c2-c6烯基、-o-c(=o)-苯基、[0144]-o-c(=o)-杂环、-o-c(=o)-o-c1-c6烷基、-o-c(=o)-o-c2-c6烯基、[0145]-o-c(=o)-o-苯基和-o-c(=o)-o-杂环。[0146]在实施方案中,小分子具有根据式ii的结构:[0147][0148]其中:[0149]r2选自由以下组成的组:h、c1-c6烷基、c2-c6烯基、-(ch2)n-r6、[0150]-c(=o)-r4、-c(=o)-o-r4、-chr5-o-c(=o)-r4、-s-c1-c6烷基、-s-c2-c6烯基、[0151]-s-杂环和-s-ch2-杂环;[0152]或r2是–s-[式ii],使得所述化合物形成通过二硫(-s-s-)键连接的两个式ii分子的二聚体;[0153]r3选自由以下组成的组:oh、氨基、f、cl、br、磷酸酯基、焦磷酸酯基、[0154]-o-c(=o)-c1-c6烷基、-o-c(=o)-c1-c6烯基、-o-c(=o)-苯基、[0155]-o-c(=o)-杂环、-o-c(=o)-o-c1-c6烷基、-o-c(=o)-o-c1-c6烯基、[0156]-o-c(=o)-o-苯基、-o-c(=o)-o-杂环;[0157]r4选自由以下组成的组:h、c1-c6烷基、c2-c6烯基、c3-c7环烷基、c6-c10双环基、c9-c14三环基、-(c1-c6烷基)-芳基、-(c2-c6烯基)-芳基、芳基、杂芳基和杂环基;[0158]r5选自由以下组成的组:h、c1-c6烷基、c2-c6烯基、c3-c7环烷基、芳基、杂芳基和杂环基;[0159]r6是羟基、氨基、酰胺基、c1-c6烷氧基、c3-c7环烷基、c6-c10双环基、芳基、杂芳基和杂环基;且[0160]n是1至8;[0161]且其中所述烷基、烯基、环烷基、双环基、三环基、芳基、杂芳基和杂环基中的每一个可未被取代或被1至3个选自由以下组成的组的取代基取代:卤素、羟基、氨基、氰基、酰胺基、磺酰胺、硝基、-sh、c1-c6烷基、c2-c6烯基、c3-c7环烷基、c6-c10双环基、c1-c6卤烷基、c1-c6全卤烷基、-o-(c1-c6烷基)、o-(c3-c7环烷基)、-o-(c1-c6卤烷基)、-o-(c1-c6全卤烷基)、芳基、-o-芳基、-(c1-c6烷基)-芳基、-o-(c1-c6烷基)-芳基、-s-(c1-c6烷基)、-s-(c3-c7环烷基)、-s-(c1-c6卤烷基)、-s-(c1-c6全卤烷基)、-s-芳基、-s-(c1-c6烷基)-芳基、杂芳基和杂环基。[0162]在实施方案中,小分子具有根据式iii的结构:[0163][0164]其中:[0165]r2选自由以下组成的组:h、c1-c6烷基、c2-c6烯基、-(ch2)n-r6、[0166]-c(=o)-r4、-c(=o)-o-r4、-chr5-o-c(=o)-r4、-s-c1-c6烷基、-s-c2-c6烯基、[0167]-s-杂环和-s-ch2-杂环;[0168]r31选自由oh和磷酸酯基组成的组;[0169]r4选自由以下组成的组:h、c1-c6烷基、c2-c6烯基、c3-c7环烷基、c6-c10双环基、c9-c14三环基、-(c1-c6烷基)-芳基、-(c2-c6烯基)-芳基、芳基、杂芳基和杂环基;[0170]r5选自由以下组成的组:h、c1-c6烷基、c2-c6烯基、c3-c7环烷基、芳基、杂芳基和杂环基;[0171]r6是羟基、氨基、酰胺基、c1-c6烷氧基、c3-c7环烷基、c6-c10双环基、芳基、杂芳基和杂环基;且[0172]n是1至8;[0173]且其中所述烷基、烯基、环烷基、双环基、三环基、芳基、杂芳基和杂环基中的每一个可未被取代或被1至3个选自由以下组成的组的取代基取代:卤素、羟基、氨基、氰基、酰胺基、磺酰胺、硝基、-sh、c1-c6烷基、c2-c6烯基、c3-c7环烷基、c6-c10双环基、c1-c6卤烷基、c1-c6全卤烷基、-o-(c1-c6烷基)、o-(c3-c7环烷基)、-o-(c1-c6卤烷基)、-o-(c1-c6全卤烷基)、芳基、-o-芳基、-(c1-c6烷基)-芳基、-o-(c1-c6烷基)-芳基、-s-(c1-c6烷基)、-s-(c3-c7环烷基)、-s-(c1-c6卤烷基)、-s-(c1-c6全卤烷基)、-s-芳基、-s-(c1-c6烷基)-芳基、杂芳基和杂环基。[0174]在实施方案中,小分子具有根据式iv的结构:[0175][0176]其中:[0177]r4选自由以下组成的组:h、c1-c6烷基、c2-c6烯基、c3-c7环烷基、c6-c10双环基、c9-c14三环基、-(c1-c6烷基)-芳基、-(c2-c6烯基)-芳基、芳基、杂芳基和杂环基;[0178]r5选自由以下组成的组:h、c1-c6烷基、c2-c6烯基、c3-c7环烷基、芳基、杂芳基和杂环基;[0179]且其中所述烷基、烯基、环烷基、双环基、三环基、芳基、杂芳基和杂环基中的每一个可未被取代或被1至3个选自由以下组成的组的取代基取代:卤素、羟基、氨基、氰基、酰胺基、磺酰胺、硝基、-sh、c1-c6烷基、c2-c6烯基、c3-c7环烷基、c6-c10双环基、c1-c6卤烷基、c1-c6全卤烷基、-o-(c1-c6烷基)、o-(c3-c7环烷基)、-o-(c1-c6卤烷基)、-o-(c1-c6全卤烷基)、芳基、-o-芳基、-(c1-c6烷基)-芳基、-o-(c1-c6烷基)-芳基、-s-(c1-c6烷基)、-s-(c3-c7环烷基)、-s-(c1-c6卤烷基)、-s-(c1-c6全卤烷基)、-s-芳基、-s-(c1-c6烷基)-芳基、杂芳基和杂环基。[0180]在实施方案中,小分子具有根据式v的结构:[0181][0182]其中:[0183]r4选自由以下组成的组:h、c1-c6烷基、c2-c6烯基、c3-c7环烷基、c6-c10双环基、c9-c14三环基、-(c1-c6烷基)-芳基、-(c2-c6烯基)-芳基、芳基、杂芳基和杂环基;[0184]且其中所述烷基、烯基、环烷基、双环基、三环基、芳基、杂芳基和杂环基中的每一个可未被取代或被1至3个选自由以下组成的组的取代基取代:卤素、羟基、氨基、氰基、酰胺卤烷基、c1-c6全卤烷基、-o-(c1-c6烷基)、o-(c3-c7环烷基)、-o-(c1-c6卤烷基)、-o-(c1-c6全卤烷基)、芳基、-o-芳基、-(c1-c6烷基)-芳基、-o-(c1-c6烷基)-芳基、-s-(c1-c6烷基)、-s-(c3-c7环烷基)、-s-(c1-c6卤烷基)、-s-(c1-c6全卤烷基)、-s-芳基、-s-(c1-c6烷基)-芳基、杂芳基和杂环基;且[0195]m是0、1、2、3或4。[0196]在一些实施方案中,小分子具有根据式viii的结构:[0197][0198]其中:[0199]每个r8独立地选自卤素、羟基、氨基、氰基、酰胺基、磺酰胺、硝基、-sh、c1-c6烷基、c2-c6烯基、c3-c7环烷基、c6-c10双环基、c1-c6卤烷基、c1-c6全卤烷基、-o-(c1-c6烷基)、o-(c3-c7环烷基)、-o-(c1-c6卤烷基)、-o-(c1-c6全卤烷基)、芳基、-o-芳基、-(c1-c6烷基)-芳基、-o-(c1-c6烷基)-芳基、-s-(c1-c6烷基)、-s-(c3-c7环烷基)、-s-(c1-c6卤烷基)、-s-(c1-c6全卤烷基)、-s-芳基、-s-(c1-c6烷基)-芳基、杂芳基和杂环基;[0200]另外或替代地,两个相邻的r8基团可一起形成稠合的5或6元芳族或非芳族环,其含有0至2个环杂原子并且未被取代或被至多四个选自以下的取代基取代:卤素、羟基、氨基、氰基、酰胺基、磺酰胺、硝基、-sh、c1-c6烷基、c2-c6烯基、c3-c7环烷基、c6-c10双环基、c1-c6卤烷基、c1-c6全卤烷基、-o-(c1-c6烷基)、o-(c3-c7环烷基)、-o-(c1-c6卤烷基)、-o-(c1-c6全卤烷基)、芳基、-o-芳基、-(c1-c6烷基)-芳基、-o-(c1-c6烷基)-芳基、-s-(c1-c6烷基)、-s-(c3-c7环烷基)、-s-(c1-c6卤烷基)、-s-(c1-c6全卤烷基)、-s-芳基、-s-(c1-c6烷基)-芳基、杂芳基和杂环基;[0201]每个r9独立地选自卤素、羟基、氨基、氰基、酰胺基、磺酰胺、硝基、-sh、c1-c6烷基、c2-c6烯基、c3-c7环烷基、c6-c10双环基、c1-c6卤烷基、c1-c6全卤烷基、-o-(c1-c6烷基)、o-(c3-c7环烷基)、-o-(c1-c6卤烷基)、-o-(c1-c6全卤烷基)、芳基、-o-芳基、-(c1-c6烷基)-芳基、-o-(c1-c6烷基)-芳基、-s-(c1-c6烷基)、-s-(c3-c7环烷基)、-s-(c1-c6卤烷基)、-s-(c1-c6全卤烷基)、-s-芳基、-s-(c1-c6烷基)-芳基、杂芳基和杂环基;[0202]另外或替代地,两个相邻的r9基团可一起形成稠合的5或6元芳族或非芳族环,其含有0至2个环杂原子并且未被取代或被至多四个选自以下的取代基取代:卤素、羟基、氨基、氰基、酰胺基、磺酰胺、硝基、-sh、c1-c6烷基、c2-c6烯基、c3-c7环烷基、c6-c10双环基、c1-c6卤烷基、c1-c6全卤烷基、-o-(c1-c6烷基)、o-(c3-c7环烷基)、-o-(c1-c6卤烷基)、-o-(c1-c6全卤烷基)、芳基、-o-芳基、-(c1-c6烷基)-芳基、-o-(c1-c6烷基)-芳基、-s-(c1-c6烷基)、-s-(c3-c7环烷基)、-s-(c1-c6卤烷基)、-s-(c1-c6全卤烷基)、-s-芳基、-s-(c1-c6烷基)-芳基、杂芳基和杂环基;[0203]x是0、1、2或3;且[0204]y是0、1、2、3或4。[0205]在一些实施方案中,适体与小分子结合或以其它方式响应小分子的存在,所述小分子选自由以下组成的组:醋糠硫胺、乙酰硫胺、蒜硫胺、氨丙啉、氯硫胺、苯磷硫胺、苯甲硫胺、双苯甲硫胺、西托硫胺、赛可硫胺、呋喃硫胺、磷硫胺、奥托硫胺、羟硫胺、丙舒硫胺、舒布硫胺、硫胺、焦磷酸硫胺和苯酰乙烯硫胺。在优选实施方案中,适体与小分子结合或以其它方式响应小分子的存在,所述小分子选自由苯磷硫胺、呋喃硫胺和丙舒硫胺组成的组。在一些实施方案中,适体与苯磷硫胺结合或以其它方式响应苯磷硫胺的存在。在实施方案中,适体与苯磷硫胺结合或以其它方式响应苯磷硫胺的存在。在实施方案中,适体与丙舒硫胺结合或以其它方式响应丙舒硫胺的存在。[0206]在一些实施方案中,与等摩尔量的呋喃硫胺、苯磷硫胺或丙舒硫胺相比,适体具有减少的与焦磷酸硫胺(tpp)的结合和/或显示对焦磷酸硫胺(tpp)的响应降低。在一些实施方案中,适体在作为用于调节靶基因的表达的多核苷酸盒的一部分编码的核糖开关的背景下,与等摩尔量的呋喃硫胺、苯磷硫胺或丙舒硫胺相比,所述适体对tpp的响应降低。[0207]还提供了响应小分子而调节靶基因表达的核糖开关,其中所述核糖开关包含本文公开的适体。在一个实施方案中,核糖开关编码序列包含seqidno:37的序列。[0208]还提供了响应小分子而调节靶基因的表达的多核苷酸盒,所述多核苷酸盒包含:[0209](a)核糖开关;和[0210](b)两侧为5'内含子和3'内含子的选择性剪接的外显子,[0211]其中核糖开关包含(i)包含茎的效应区域,所述茎包括3'内含子的5'剪接位点序列,和(ii)本文公开的适体;且[0212]其中所述选择性剪接的外显子包含终止密码子,当所述选择性剪接的外显子被剪接至靶基因mrna中时,所述终止密码子与所述靶基因同框。[0213]在一个实施方案中,多核苷酸盒包含核糖开关编码序列,所述序列包含seqidno:37的序列并且还包含适体编码序列,其中所述适体序列选自本文公开的适体序列。[0214]在一个实施方案中,提供了一种核酸分子,其包含本文公开的适体、核糖开关和/或多核苷酸盒。还提供了包含靶基因的核酸分子,所述靶基因含有本文公开的核糖开关或多核苷酸盒。在一个实施方案中,多核苷酸盒位于靶基因的蛋白质编码序列中。在一个实施方案中,多核苷酸盒位于靶基因的非翻译区或靶基因的内含子中。[0215]还提供了包含本文公开的任何核酸分子的载体。在一个实施方案中,载体是病毒载体。在一些实施方案中,病毒载体选自由腺病毒载体、腺相关病毒载体和慢病毒载体组成的组。[0216]在一个方面,提供了一种鉴定响应感兴趣的化合物(例如硫胺类似物或衍生物,例如根据式i-viii的化合物)而调节靶基因表达的适体的方法,所述方法包括步骤:[0217](i)选择亲本适体序列;[0218](ii)产生包含编码在步骤(i)中选择的所有或部分适体的序列的核糖开关文库,其中所述适体编码序列在适体的一个或多个未配对区域中包含一个或多个随机突变的核苷酸,其中所述突变的适体序列在控制报告基因的表达的核糖开关的背景下;[0219](iii)针对与亲本适体序列相比,响应暴露于所述感兴趣的化合物而增加对所述靶基因表达的调节(例如,更高倍数的诱导或抑制)的适体筛选来自(ii)的文库;[0220](iv)任选地对在步骤(iii)中鉴定的适体而不是在步骤(i)中选择的适体重复步骤(ii)和(iii)。[0221]在实施方案中,亲本适体序列是ttp适体(包括推定tpp适体或已知tpp适体)。在实施方案中,亲本适体序列选自rfamtpp核糖开关家族rf00059。在实施方案中,适体序列的一个或多个未配对区域是连接(j)区域。另外或替代地,未配对区域可以是环(l)区域。在另外的实施方案中,在一个或多个未配对区域中具有一个或多个随机突变的核苷酸的编码适体的序列在配对(p)区域中也具有一个或多个突变的核苷酸,例如在一个或多个与未配对区域相邻的配对核苷酸中。[0222]在实施方案中,感兴趣的化合物是硫胺类似物或衍生物。在实施方案中,硫胺类似物是呋喃硫胺、苯磷硫胺或丙舒硫胺。在一个实施方案中,与等摩尔量的呋喃硫胺、苯磷硫胺或丙舒硫胺相比,适体具有减少的与焦磷酸硫胺(tpp)的结合和/或显示对焦磷酸硫胺(tpp)的响应降低。在实施方案中,感兴趣的化合物是根据式i-viii的化合物,在实施方案中,感兴趣的化合物是根据式i-iii的化合物。[0223]在一些方面,本公开提供了式i-viii的化合物。在实施方案中,本公开提供了含式i-viii的化合物的药物组合物。附图说明[0224]图1说明了分别包含thic和thimtpp适体的合成核糖开关tppz或tppm响应用焦磷酸硫胺(tpp)或硫胺类似物处理而诱导荧光素酶表达。用含有含tppz或tppm核糖开关的荧光素酶基因的构建体转染hek293细胞。转染的细胞用指定剂量的tpp(图1a)、呋喃硫胺(图1b)、丙舒硫胺(图1c)、双苯甲硫胺、氯硫胺或舒布硫胺(图1d)处理或未经处理。荧光素酶活性表示为平均任意光单位(alu)±s.d.,且诱导倍数计算为暴露于tpp或硫胺类似物的细胞记录的荧光素酶活性除以未暴露于tpp或硫胺类似物的细胞记录的荧光素酶活性的商。[0225]图2说明了从tpp适体家族(rfam家族rf00059)中减去的推定适体序列(14g4)响应呋喃硫胺而调节荧光素酶表达。用包含推定tpp适体14g4(登录号aacy023654033.1/903-800,来自rfamrf00059)的荧光素酶-核糖开关构建体转染细胞。在hek293细胞(图2a)或其它类型的人和小鼠细胞系(图2b)中,用指定剂量的呋喃硫胺处理转染的细胞。诱导倍数计算为暴露于呋喃硫胺的细胞记录的荧光素酶活性除以未暴露于呋喃硫胺的细胞记录的荧光素酶活性的商。[0226]图3显示了具有天然p1茎的亲本适体14g4(seqidno:38)(图3a)以及适体14g4编码序列(seqidno:7)和由此衍生的文库(图3b)的预测结构。如本文所述地确定14g4适体的预测结构,包括茎和未配对区域的位置。每个碱基周围的结构阴影表示其碱基配对概率,其中较暗的阴影表示较高的概率。对于未配对区域,较暗的阴影表示未配对的概率。随机突变以获得适体文库a1(seqidno:39)、a2(seqidno:40)或a3(seqidno:41)的核苷酸分别在图3b中的适体编码序列中用“n”表示,且对应于未配对或与未配对区域相邻的核苷酸。[0227]图4说明了通过核糖开关中所含的适体的诱变来提高基因调节活性。筛选包含随机突变的适体(衍生自适体文库a1、a2或a3)的核糖开关构建体,以提高hek细胞中的基因调节活性。转染的hek细胞用50μm呋喃硫胺处理或未经处理。图4a中显示了包含在筛选中分离并且与核糖开关14g4相比表现出提高的基因调节活性的再工程化适体序列的核糖开关的实例。图4b说明了包含再工程化适体序列的核糖开关可用于不同类型的细胞中靶基因的剂量依赖性诱导。使用transit-x2试剂,用再工程化核糖开关构建体转染aml12、c2c12和arpe-19细胞。用指定剂量的呋喃硫胺处理转染的细胞。图4c说明了包含再工程化适体序列的核糖开关响应不同的tpp类似物而调节荧光素酶表达。aml12细胞用包含再工程化适体序列的核糖开关转染,并用指定剂量的呋喃硫胺、苯磷硫胺或丙舒硫胺处理。图4a-4c:诱导倍数计算为暴露于tpp或硫胺类似物的细胞记录的荧光素酶活性除以未暴露于tpp或硫胺类似物的细胞记录的荧光素酶活性的商。[0228]图5显示了通过14g4的诱变获得的3h4适体编码序列(seqidno:9)的核苷酸序列。随机突变以获得适体文库a4(seqidno:42)的核苷酸在适体编码序列中用“n”表示。[0229]图6a说明了与适体/配体结合有关的所选适体核苷酸的诱变可提高哺乳动物细胞中基于适体的核糖开关的基因调节活性。hek293、arpe-19和aml12细胞用包含从适体文库a4分离的再工程化适体序列的核糖开关构建体转染。转染的细胞用指定剂量的呋喃硫胺处理或未经处理。图6b说明了包含再工程化适体序列的核糖开关响应与硫胺共享化学结构特征的不同硫胺衍生物而诱导荧光素酶表达的能力。aml12细胞用指定的核糖开关构建体转染,并用指定剂量的呋喃硫胺、苯磷硫胺或丙舒硫胺处理或未经处理。诱导倍数计算为从用硫胺类似物化合物处理的细胞获得的荧光素酶活性除以从未用硫胺类似物处理的细胞获得的荧光素酶活性的商。[0230]图7说明了包含再工程化适体序列的核糖开关响应配体而诱导多种靶基因的表达的能力。图7a和7b说明了包含适体6b4的核糖开关响应呋喃硫胺处理而调节增强的绿荧光蛋白(egfp)表达。含有egfp-6b4构建体的稳定转染的hek293细胞用50μm(图7a)或指定剂量(图7b)的呋喃硫胺处理24小时或未经处理。图7b和7c说明了包含3h4或15d10的核糖开关分别响应呋喃硫胺处理而调节小鼠红细胞生成素(mepo)表达。用epo-3h4或epo-15d10构建体转染aml12细胞。转染的细胞用指定剂量的呋喃硫胺处理或未经处理。使用mepoelisa检测和量化mepo的表达,并表示为平均值±s.d.(图7c)。诱导倍数计算为用呋喃硫胺处理的细胞产生的mepo的量除以未用呋喃硫胺处理的细胞产生的mepo的量的商(图7d)。[0231]图8说明了由包含再工程化适体序列的核糖开关在体内诱导的荧光素酶表达。产生含有内含子-选择性外显子-内含子盒的腺相关aav2/8病毒颗粒,所述盒具有(1)不含适体的不可调节核糖开关(“对照1”),(2)包含适体3h4的核糖开关盒(“开关3h4”或“3h4”),或(3)包含适体6b4的核糖开关盒(“开关6b4”或“6b4”)。向balb/c小鼠(n=5每组)单次尾静脉注射1.0×1011个(图8a、8b和8d)或2.5×1011个(图8c和8e)病毒颗粒/小鼠。aav递送后二十八天,向小鼠腹膜内注射50mg/kg丙舒硫胺。在给药前一天以及给药后6小时、24小时、48小时和72小时测量荧光素酶活性。在第一次施用丙舒硫胺后,对小鼠进行如下三轮额外的给药和成像周期:第36天(aav施用后):100mg/kg;第43天:200mg/kg;以及第51天:400mg/kg。图8a显示了用包含具有再工程化核糖开关3h4或6b4的荧光素酶基因的aav载体转染的小鼠在一定时间点和指定丙舒硫胺剂量下的荧光素酶表达。图8b和8c显示了不同组在给药前一天以及给药后6小时、24小时、48小时和72小时观察到的荧光素酶荧光强度。图8d和8e显示了在不同药物剂量和组的给药之后,在丙舒硫胺后荧光素酶表达的相对增加。荧光素酶表达的诱导倍数计算为从用丙舒硫胺的小鼠获得的光子/秒除以在丙舒硫胺前一天从小鼠获得的值的商。[0232]图9显示了与式iv、v和vi的其它硫胺类似物相比,响应呋喃硫胺或苯磷硫胺诱导的荧光素酶靶基因表达。荧光素酶靶基因含有编码包含15d10适体的核糖开关的序列。测试了第iv组化合物在hek293(图9a)和aml12(图9b)细胞中诱导荧光素酶表达的能力。测试了第v组和第vi组化合物在hek293(图9c)和aml12(图9d)细胞中诱导荧光素酶表达的能力。进一步测试了最有效的化合物在arpe-19(图9e)和hepg2(图9f)细胞中诱导荧光素酶表达的能力。具体实施方式[0233]本文提供了与小分子,如硫胺或tpp以及硫胺或tpp的类似物或衍生物结合或以其它方式响应其存在的适体序列。在一些实施方案中,本文提供的适体序列可用于响应硫胺或tpp的类似物或衍生物而调节靶基因的表达。还考虑了包含本文公开的适体序列的核糖开关,以及用于调节靶基因的表达的多核苷酸盒,其中所述多核苷酸盒包含编码本文公开的核糖开关的序列。本文还提供了使用适体、核糖开关和/或多核苷酸盒来调节靶基因,包括基因,以及有需要的受试者的方法。[0234]适体[0235]适体是单链核酸分子,其通过折叠成三维结构而以高亲和力和特异性与特定配体非共价结合。适体配体包括离子、小分子、蛋白质、病毒和细胞。适体配体可为例如有机化合物、氨基酸、类固醇、碳水化合物或核苷酸。小分子适体配体的非限制性实例包括抗生素、剂、染料、辅因子、代谢物、分子标记、神经递质、污染物、毒素、食品掺杂物、致癌物、滥用药物。因此,适体可用于检测小分子。适体检测小分子的应用包括环境监测、食品安全、医学(包括诊断学)、微生物学、分析化学、法医学、农业和基础生物学研究。[0236]如本文所用,术语“适体”是指与一类配体特异性结合的rna多核苷酸(或编码rna多核苷酸的dna序列)。术语“配体”是指由适体特异性结合的分子。适体具有能够与预期的靶分子(即配体)形成复合物的结合区域。适体的长度典型地为约15至约200个核苷酸。更常见地,适体的长度为约30至约100个核苷酸,例如70至90个核苷酸。适体典型地包含多个配对(p)区域,其中适体形成茎和未配对区域,其中适体形成连接(j)区域或环(l)区域。成对区域可从5′端(p1)开始按顺序编号,并按顺序对每个茎进行编号(p2、p3等)。环(l1、l2等)基于相邻的成对区域进行编号,并且连接区域根据它们连接的成对区域进行编号。[0237]在一个实施方案中,适体编码序列包含[0238]acx1ggggtccggcx2tx3ttcatttggcx4ccggtgagax5x6ax7acccttx8x9x10x11cctgttx12acggataatgccgcx13gcagggagt(seqidno:1),[0239]其中[0240]x1是a或g;[0241]x2是c或无核苷酸;[0242]x3是t或无核苷酸;[0243]x4是a或g;[0244]x5是任何核苷酸;[0245]x6是任何核苷酸;[0246]x7是任何核苷酸;[0247]x8是任何核苷酸;[0248]x9是c、g或t;[0249]x10是任何核苷酸;[0250]x11是a或t;[0251]x12是c或t;且[0252]x13是c或t。[0253]在实施方案中,适体编码序列具有以下特性中的一种或多种:x1不是a;x2不是c;x3不是t;x4不是g;x5不是g;x6不是c;x7不是c;x8不是t;x9不是g;x10不是a;x11不是a;x12不是t;以及x13不是c。在实施方案中,以下所有者不同时存在于适体编码序列中:x1是a;x2是c;x3是t;x5是g;x6是c;x7是c;x8是t;x9是g;x10是a;x11是a;x12是t;以及x13是c。[0254]在一个实施方案中,适体编码序列包含[0255]acx1ggggtccggcx2tx3ttcatttggcgccggtgagax5x6ax7acccttx8x9x10x11cctgttx12acggataatgccgcx13gcagggagt(seqidno:2),[0256]其中[0257]x1是a或g;[0258]x2是c或无核苷酸;[0259]x3是t或无核苷酸;[0260]x5是g或t;[0261]x6是c或t;[0262]x7是c或t;[0263]x8是任何核苷酸;[0264]x9是g或t;[0265]x10是a、g或t;[0266]x11是a或t;[0267]x12是c或t;且[0268]x13是c或t。[0269]在实施方案中,适体编码序列具有以下特性中的一种或多种:x1不是a;x2不是c;x3不是t;x4不是g;x5不是g;x6不是c;x7不是c;x8不是t;x9不是g;x10不是a;x11不是a;x12不是t;以及x13不是c。在实施方案中,以下所有者不同时存在于适体序列中:x1是a;x2是c;x3是t;x5是g;x6是c;x7是c;x8是t;x9是g;x10是a;x11是a;x12是t;以及x13是c。[0270]在一个实施方案中,适体编码序列包含:acaggggtccggccttttcatttggcgccggtgagagcacaccctttgaacctgttx12acggataatgccgcx13gcagggagt(seqidno:3),[0271]其中[0272]x12是c或t;且[0273]x13是c或t。[0274]在实施方案中,适体编码序列具有以下特性中的一种或多种:x12不是t;以及x13不是c。在实施方案中,以下所有者不同时存在于适体序列中:x12是t以及x13是c。[0275]在一个实施方案中,适体编码序列包含:acx1ggggtccggccttttcatttggcgccggtgagagcacacccttx8x9x10x11cctgtttacggataatgccgccgcagggagt(seqidno:4),[0276]其中[0277]x1是a或g;[0278]x8是任何核苷酸;[0279]x9是g或t;[0280]x10是a、g或t;且[0281]x11是a或t。[0282]在实施方案中,适体编码序列具有以下特性中的一种或多种:x1不是a;x8不是t;x9不是g;x10不是a;x11不是a。在实施方案中,以下所有者不同时存在于适体序列中:x1是a;x8是t;x9是g;x10是a;x11是a;x12是t;以及x13是c。[0283]在一个实施方案中,适体编码序列包含:[0284]acaggggtccggccttttcatttggcgccggtgagax5x6ax7accctttgaacctgtttacggataatgccgccgcagggagt(seqidno:5),[0285]其中[0286]x5是g或t;[0287]x6是c或t;且[0288]x7是c或t。[0289]在实施方案中,适体编码序列具有以下特性中的一种或多种:x5不是g;x6不是c;以及x7不是c。在实施方案中,以下所有者不同时存在于适体序列中:x5是g;x6是c;以及x7是c。[0290]在一个实施方案中,适体编码序列包含:[0291]acaggggtccggccttttcatttggcx4ccggtgagax5x6ax7acccttx8x9x10acctgttcacggataatgccgctgcagggagt(seqidno:6),[0292]其中[0293]x4是a或g;[0294]x5是任何核苷酸;[0295]x6是任何核苷酸;[0296]x7是任何核苷酸;[0297]x8是任何核苷酸;[0298]x9是c或g;且[0299]x10是任何核苷酸。[0300]在一个实施方案中,适体编码序列包含选自由seqidno:7-36组成的组的序列(参见表1)。在一个实施方案中,适体编码序列包含与选自由seqidno:7-36组成的组的序列至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%同一的序列。关于参考多肽或核酸序列的“百分比序列同一性”定义为在比对序列并引入空位(如有必要)以实现最大百分比序列同一性之后,候选序列中与参考多肽或核酸序列中的氨基酸残基或核苷酸相同的氨基酸残基或核苷酸的百分比。用于确定百分比氨基酸或核酸序列同一性的比对可以普通技术人员已知的方式实现,例如,使用包括blast、blast-2、align或megalign(dnastar)软件的公开可用的计算机软件程序。[0301]表1.适体编码序列[0302][0303][0304][0305]普通技术人员将理解,本文所述的适体可为核糖核酸(rna)分子。在实施方案中,本文所述的适体是较长rna多核苷酸,包括例如hnrna、mrna、sirna或mirna的一部分。[0306]在一个方面,提供了一种包含以下序列的适体:[0307]acx1gggguccggcx2ux3uucauuuggcx4ccggugagax5x6ax7acccuux8x9x10x11ccuguux12acggauaaugccgcx13gcagggagu(seqidno:43),[0308]其中[0309]x1是a或g;[0310]x2是c或无核苷酸;[0311]x3是u或无核苷酸;[0312]x4是a或g;[0313]x5是任何核苷酸;[0314]x6是任何核苷酸;[0315]x7是任何核苷酸;[0316]x8是任何核苷酸;[0317]x9是c、g或u;[0318]x10是任何核苷酸;[0319]x11是a或u;[0320]x12是c或u;且[0321]x13是c或u。[0322]在实施方案中,适体序列具有以下特性中的一种或多种:x1不是a;x2不是c;x3不是u;x4不是g;x5不是g;x6不是c;x7不是c;x8不是u;x9不是g;x10不是a;x11不是a;x12不是u;以及x13不是c。[0323]在实施方案中,以下所有者不同时存在于适体序列中:x1是a;x2是c;x3是u;x4是g;x5是g;x6是c;x7是c;x8是u;x9是g;x10是a;x11是a;x12是u;以及x13是c。[0324]在一个方面,提供了一种包含以下序列的适体:[0325]acx1gggguccggcx2ux3uucauuuggcgccggugagax5x6ax7acccuux8x9x10x11ccuguux12acggauaaugccgcx13gcagggagu(seqidno:44),[0326]其中[0327]x1是a或g;[0328]x2是c或无核苷酸;[0329]x3是u或无核苷酸;[0330]x5是g或u;[0331]x6是c或u;[0332]x7是c或u;[0333]x8是任何核苷酸;[0334]x9是g或u;[0335]x10是a、g或u;[0336]x11是a或u;[0337]x12是c或u;且[0338]x13是c或u。[0339]在实施方案中,适体序列具有以下特性中的一种或多种:x1不是a;x2不是c;x3不是u;x4不是g;x5不是g;x6不是c;x7不是c;x8不是u;x9不是g;x10不是a;x11不是a;x12不是u;以及x13不是c。在实施方案中,以下所有者不同时存在于适体序列中:x1是a;x2是c;x3是u;x5是g;x6是c;x7是c;x8是u;x9是g;x10是a;x11是a;x12是u;以及x13是c。[0340]在一个方面,提供了一种包含以下序列的适体:[0341]acagggguccggccuuuucauuuggcgccggugagagcacacccuuugaaccuguux12acggauaaugccgcx13gcagggagu(seqidno:45),[0342]其中[0343]x12是c或u;且[0344]x13是c或u。[0345]在实施方案中,适体序列具有以下特性中的一种或多种:x12不是u;以及x13不是c。在实施方案中,以下所有者不同时存在于适体序列中:x12是u以及x13是c。[0346]在一个方面,提供了一种包含以下序列的适体:[0347]acx1gggguccggccuuuucauuuggcgccggugagagcacacccuux8x9x10x11ccuguuuacggauaaugccgccgcagggagu(seqidno:46),[0348]其中[0349]x1是a或g;[0350]x8是任何核苷酸;[0351]x9是g或u;[0352]x10是a、g或u;且[0353]x11是a或u。[0354]在实施方案中,适体序列具有以下特性中的一种或多种:x1不是a;x8不是u;x9不是g;x10不是a;以及x11不是a。在实施方案中,以下所有者不同时存在于适体序列中:x1是a;x8是u;x9是g;x10是a;x11是a;x12是u;以及x13是c。[0355]在一个方面,提供了一种包含以下序列的适体:[0356]acagggguccggccuuuucauuuggcgccggugagax5x6ax7acccuuugaaccuguuuacggauaaugccgccgcagggagu(seqidno:47),[0357]其中[0358]x5是g或u;[0359]x6是c或u;且[0360]x7是c或u。[0361]在实施方案中,适体序列具有以下特性中的一种或多种:x5不是g;x6不是c;以及x7不是c。在实施方案中,以下所有者不同时存在于适体序列中:x5是g;x6是c;以及x7是c。[0362]在一个方面,提供了一种包含以下序列的适体:[0363]acagggguccggccuuuucauuuggcx4ccggugagax5x6ax7acccuux8x9x10accuguucacggauaaugccgcugcagggagu(seqidno:48),[0364]其中[0365]x4是a或g;[0366]x5是任何核苷酸;[0367]x6是任何核苷酸;[0368]x7是任何核苷酸;[0369]x8是任何核苷酸;[0370]x9是c或g;且[0371]x10是任何核苷酸。[0372]在一个方面,提供了一种与小分子结合的适体,其中所述适体包含与选自由seqidno:49-78组成的组的序列至少95%、至少96%、至少97%、至少98%或至少99%同一的序列。在一些实施方案中,适体序列包含选自由seqidno:49-78组成的组的序列。在实施方案中,适体序列包含选自由seqidno:51、56和68组成的组的序列。[0373]适体配体[0374]在一个实施方案中,适体配体是硫胺(维生素b1)或者是硫胺类似物和/或是硫胺衍生物。如本文所用,术语“硫胺类似物”是指与硫胺相比具有相似的物理、化学、生物化学或药理学特性的分子,并且包括例如氨丙啉或赛可硫胺。硫胺类似物可为硫胺衍生物。如本文所用,术语“硫胺衍生物”是指通过修饰或取代衍生自硫胺或其噻唑开环形式的化合物。硫胺衍生物可包括例如醋糠硫胺、乙酰硫胺、蒜硫胺、氯硫胺、苯磷硫胺、苯甲硫胺、双苯甲硫胺、西托硫胺、呋喃硫胺、磷硫胺、奥托硫胺、丙舒硫胺、舒布硫胺、硫胺、焦磷酸硫胺或苯酰乙烯硫胺。[0375]在一些实施方案中,适体与本文公开的小分子,包括具有根据式i-viii的结构的小分子结合或以其它方式响应所述小分子的存在或添加。在实施方案中,小分子具有根据式i的结构:[0376][0377]其中:[0378]r1选自由以下组成的组:oh、氨基、f、cl、br、磷酸酯基、焦磷酸酯基、[0379]-o-c(=o)-c1-c6烷基、-o-c(=o)-c2-c6烯基、-o-c(=o)-苯基、[0380]-o-c(=o)-杂环、-o-c(=o)-o-c1-c6烷基、-o-c(=o)-o-c2-c6烯基、[0381]-o-c(=o)-o-苯基和-o-c(=o)-o-杂环。[0382]在实施方案中,小分子具有根据式ii的结构:[0383][0384]其中:[0385]r2选自由以下组成的组:h、c1-c6烷基、c2-c6烯基、-(ch2)n-r6、[0386]-c(=o)-r4、-c(=o)-o-r4、-chr5-o-c(=o)-r4、-s-c1-c6烷基、-s-c2-c6烯基、[0387]-s-杂环和-s-ch2-杂环;[0388]或r2是–s-[式ii],使得所述化合物形成通过二硫(-s-s-)键连接的两个式ii分子的二聚体;[0389]r3选自由以下组成的组:oh、氨基、f、cl、br、磷酸酯基、焦磷酸酯基、[0390]-o-c(=o)-c1-c6烷基、-o-c(=o)-c1-c6烯基、-o-c(=o)-苯基、[0391]-o-c(=o)-杂环、-o-c(=o)-o-c1-c6烷基、-o-c(=o)-o-c1-c6烯基、[0392]-o-c(=o)-o-苯基、-o-c(=o)-o-杂环;[0393]r4选自由以下组成的组:h、c1-c6烷基、c2-c6烯基、c3-c7环烷基、c6-c10双环基、c9-c14三环基、-(c1-c6烷基)-芳基、-(c2-c6烯基)-芳基、芳基、杂芳基和杂环基;[0394]r5选自由以下组成的组:h、c1-c6烷基、c2-c6烯基、c3-c7环烷基、芳基、杂芳基和杂环基;[0395]r6是羟基、氨基、酰胺基、c1-c6烷氧基、c3-c7环烷基、c6-c10双环基、芳基、杂芳基和杂环基;且[0396]n是1至8;[0397]且其中所述烷基、烯基、环烷基、双环基、芳基、杂芳基和杂环基中的每一个可未被取代或被1至3个选自由以下组成的组的取代基取代:卤素、羟基、氨基、氰基、酰胺基、磺酰胺、硝基、-sh、c1-c6烷基、c2-c6烯基、c3-c7环烷基、c6-c10双环基、c1-c6卤烷基、c1-c6全卤烷基、-o-(c1-c6烷基)、o-(c3-c7环烷基)、-o-(c1-c6卤烷基)、-o-(c1-c6全卤烷基)、芳基、-o-芳基、-(c1-c6烷基)-芳基、-o-(c1-c6烷基)-芳基、-s-(c1-c6烷基)、-s-(c3-c7环烷基)、-s-(c1-c6卤烷基)、-s-(c1-c6全卤烷基)、-s-芳基、-s-(c1-c6烷基)-芳基、杂芳基和杂环基。[0398]在实施方案中,小分子具有根据式iii的结构:[0399][0400]其中:[0401]r2选自由以下组成的组:h、c1-c6烷基、c2-c6烯基、-(ch2)n-r6、[0402]-c(=o)-r4、-c(=o)-o-r4、-chr5-o-c(=o)-r4、-s-c1-c6烷基、-s-c2-c6烯基、[0403]-s-杂环和-s-ch2-杂环;[0404]r31选自由oh和磷酸酯基组成的组;[0405]r4选自由以下组成的组:h、c1-c6烷基、c2-c6烯基、c3-c7环烷基、c6-c10双环基、c9-c14三环基、-(c1-c6烷基)-芳基、-(c2-c6烯基)-芳基、芳基、杂芳基和杂环基;[0406]r5选自由以下组成的组:h、c1-c6烷基、c2-c6烯基、c3-c7环烷基、芳基、杂芳基和杂环基;[0407]r6是羟基、氨基、酰胺基、c1-c6烷氧基、c3-c7环烷基、c6-c10双环基、芳基、杂芳基和杂环基;且[0408]n是1至8;[0409]且其中所述烷基、烯基、环烷基、双环基、三环基、芳基、杂芳基和杂环基中的每一个可未被取代或被1至3个选自由以下组成的组的取代基取代:卤素、羟基、氨基、氰基、酰胺基、磺酰胺、硝基、-sh、c1-c6烷基、c2-c6烯基、c3-c7环烷基、c6-c10双环基、c1-c6卤烷基、c1-c6全卤烷基、-o-(c1-c6烷基)、o-(c3-c7环烷基)、-o-(c1-c6卤烷基)、-o-(c1-c6全卤烷基)、芳基、-o-芳基、-(c1-c6烷基)-芳基、-o-(c1-c6烷基)-芳基、-s-(c1-c6烷基)、-s-(c3-c7环烷基)、-s-(c1-c6卤烷基)、-s-(c1-c6全卤烷基)、-s-芳基、-s-(c1-c6烷基)-芳基、杂芳基和杂环基。[0410]在实施方案中,小分子具有根据式iv的结构:[0411][0412]其中:[0413]r4选自由以下组成的组:h、c1-c6烷基、c2-c6烯基、c3-c7环烷基、c6-c10双环基、c9-c14三环基、-(c1-c6烷基)-芳基、-(c2-c6烯基)-芳基、芳基、杂芳基和杂环基;[0414]r5选自由以下组成的组:h、c1-c6烷基、c2-c6烯基、c3-c7环烷基、芳基、杂芳基和杂环基;[0415]且其中所述烷基、烯基、环烷基、双环基、三环基、芳基、杂芳基和杂环基中的每一个可未被取代或被1至3个选自由以下组成的组的取代基取代:卤素、羟基、氨基、氰基、酰胺基、磺酰胺、硝基、-sh、c1-c6烷基、c2-c6烯基、c3-c7环烷基、c6-c10双环基、c1-c6卤烷基、c1-c6全卤烷基、-o-(c1-c6烷基)、o-(c3-c7环烷基)、-o-(c1-c6卤烷基)、-o-(c1-c6全卤烷基)、芳基、-o-芳基、-(c1-c6烷基)-芳基、-o-(c1-c6烷基)-芳基、-s-(c1-c6烷基)、-s-(c3-c7环烷基)、-s-(c1-c6卤烷基)、-s-(c1-c6全卤烷基)、-s-芳基、-s-(c1-c6烷基)-芳基、杂芳基和杂环基。[0416]在实施方案中,小分子具有根据式v的结构:[0417][0418]其中:[0419]r4选自由以下组成的组:h、c1-c6烷基、c2-c6烯基、c3-c7环烷基、c6-c10双环基、c9-c14三环基、-(c1-c6烷基)-芳基、-(c2-c6烯基)-芳基、芳基、杂芳基和杂环基;[0420]且其中所述烷基、烯基、环烷基、双环基、三环基、芳基、杂芳基和杂环基中的每一个可未被取代或被1至3个选自由以下组成的组的取代基取代:卤素、羟基、氨基、氰基、酰胺基、磺酰胺、硝基、-sh、c1-c6烷基、c2-c6烯基、c3-c7环烷基、c6-c10双环基、c1-c6卤烷基、c1-c6全卤烷基、-o-(c1-c6烷基)、o-(c3-c7环烷基)、-o-(c1-c6卤烷基)、-o-(c1-c6全卤烷基)、芳基、-o-芳基、-(c1-c6烷基)-芳基、-o-(c1-c6烷基)-芳基、-s-(c1-c6烷基)、-s-(c3-c7环烷基)、-s-(c1-c6卤烷基)、-s-(c1-c6全卤烷基)、-s-芳基、-s-(c1-c6烷基)-芳基、杂芳基和杂环基。[0421]在实施方案中,小分子具有根据式vi的结构:[0422][0423]其中:[0424]r4选自由以下组成的组:h、c1-c6烷基、c2-c6烯基、c3-c7环烷基、c6-c10双环基、c9-c14三环基、-(c1-c6烷基)-芳基、-(c2-c6烯基)-芳基、芳基、杂芳基和杂环基;[0425]且其中所述烷基、烯基、环烷基、双环基、三环基、芳基、杂芳基和杂环基中的每一个可未被取代或被1至3个选自由以下组成的组的取代基取代:卤素、羟基、氨基、氰基、酰胺基、磺酰胺、硝基、-sh、c1-c6烷基、c2-c6烯基、c3-c7环烷基、c6-c10双环基、c1-c6卤烷基、c1-c6全卤烷基、-o-(c1-c6烷基)、o-(c3-c7环烷基)、-o-(c1-c6卤烷基)、-o-(c1-c6全卤烷基)、芳基、-o-芳基、-(c1-c6烷基)-芳基、-o-(c1-c6烷基)-芳基、-s-(c1-c6烷基)、-s-(c3-c7环烷基)、-s-(c1-c6卤烷基)、-s-(c1-c6全卤烷基)、-s-芳基、-s-(c1-c6烷基)-芳基、杂芳基和杂环基。[0426]在实施方案中,小分子具有根据式vii的结构:[0427][0428]其中[0429]每个r7独立地选自卤素、羟基、氨基、氰基、酰胺基、磺酰胺、硝基、-sh、c1-c6烷基、c2-c6烯基、c3-c7环烷基、c6-c10双环基、c1-c6卤烷基、c1-c6全卤烷基、-o-(c1-c6烷基)、o-(c3-c7环烷基)、-o-(c1-c6卤烷基)、-o-(c1-c6全卤烷基)、芳基、-o-芳基、-(c1-c6烷基)-芳基、-o-(c1-c6烷基)-芳基、-s-(c1-c6烷基)、-s-(c3-c7环烷基)、-s-(c1-c6卤烷基)、-s-(c1-c6全卤烷基)、-s-芳基、-s-(c1-c6烷基)-芳基、杂芳基和杂环基;[0430]另外或替代地,两个相邻的r7基团可一起形成稠合的5或6元芳族或非芳族环,其含有0至2个环杂原子并且未被取代或被至多四个选自以下的取代基取代:卤素、羟基、氨基、氰基、酰胺基、磺酰胺、硝基、-sh、c1-c6烷基、c2-c6烯基、c3-c7环烷基、c6-c10双环基、c1-c6卤烷基、c1-c6全卤烷基、-o-(c1-c6烷基)、o-(c3-c7环烷基)、-o-(c1-c6卤烷基)、-o-(c1-c6全卤烷基)、芳基、-o-芳基、-(c1-c6烷基)-芳基、-o-(c1-c6烷基)-芳基、-s-(c1-c6烷基)、-s-(c3-c7环烷基)、-s-(c1-c6卤烷基)、-s-(c1-c6全卤烷基)、-s-芳基、-s-(c1-c6烷基)-芳基、杂芳基和杂环基;且[0431]m是0、1、2、3或4。[0432]在一些实施方案中,小分子具有根据式viii的结构:[0433][0434]其中:[0435]每个r8独立地选自卤素、羟基、氨基、氰基、酰胺基、磺酰胺、硝基、-sh、c1-c6烷基、c2-c6烯基、c3-c7环烷基、c6-c10双环基、c1-c6卤烷基、c1-c6全卤烷基、-o-(c1-c6烷基)、o-(c3-c7环烷基)、-o-(c1-c6卤烷基)、-o-(c1-c6全卤烷基)、芳基、-o-芳基、-(c1-c6烷基)-芳基、-o-(c1-c6烷基)-芳基、-s-(c1-c6烷基)、-s-(c3-c7环烷基)、-s-(c1-c6卤烷基)、-s-(c1-c6全卤烷基)、-s-芳基、-s-(c1-c6烷基)-芳基、杂芳基和杂环基;[0436]另外或替代地,两个相邻的r8基团可一起形成稠合的5或6元芳族或非芳族环,其含有0至2个环杂原子并且未被取代或被至多四个选自以下的取代基取代:卤素、羟基、氨基、氰基、酰胺基、磺酰胺、硝基、-sh、c1-c6烷基、c2-c6烯基、c3-c7环烷基、c6-c10双环基、c1-c6卤烷基、c1-c6全卤烷基、-o-(c1-c6烷基)、o-(c3-c7环烷基)、-o-(c1-c6卤烷基)、-o-(c1-c6全卤烷基)、芳基、-o-芳基、-(c1-c6烷基)-芳基、-o-(c1-c6烷基)-芳基、-s-(c1-c6烷基)、-s-(c3-c7环烷基)、-s-(c1-c6卤烷基)、-s-(c1-c6全卤烷基)、-s-芳基、-s-(c1-c6烷基)-芳基、杂芳基和杂环基;[0437]每个r9独立地选自卤素、羟基、氨基、氰基、酰胺基、磺酰胺、硝基、-sh、c1-c6烷基、c2-c6烯基、c3-c7环烷基、c6-c10双环基、c1-c6卤烷基、c1-c6全卤烷基、-o-(c1-c6烷基)、o-(c3-c7环烷基)、-o-(c1-c6卤烷基)、-o-(c1-c6全卤烷基)、芳基、-o-芳基、-(c1-c6烷基)-芳基、-o-(c1-c6烷基)-芳基、-s-(c1-c6烷基)、-s-(c3-c7环烷基)、-s-(c1-c6卤烷基)、-s-(c1-c6全卤烷基)、-s-芳基、-s-(c1-c6烷基)-芳基、杂芳基和杂环基;[0438]另外或替代地,两个相邻的r9基团可一起形成稠合的5或6元芳族或非芳族环,其含有0至2个环杂原子并且未被取代或被至多四个选自以下的取代基取代:卤素、羟基、氨基、氰基、酰胺基、磺酰胺、硝基、-sh、c1-c6烷基、c2-c6烯基、c3-c7环烷基、c6-c10双环基、c1-c6卤烷基、c1-c6全卤烷基、-o-(c1-c6烷基)、o-(c3-c7环烷基)、-o-(c1-c6卤烷基)、-o-(c1-c6全卤烷基)、芳基、-o-芳基、-(c1-c6烷基)-芳基、-o-(c1-c6烷基)-芳基、-s-(c1-c6烷基)、-s-(c3-c7环烷基)、-s-(c1-c6卤烷基)、-s-(c1-c6全卤烷基)、-s-芳基、-s-(c1-c6烷基)-芳基、杂芳基和杂环基;[0439]x是0、1、2或3;且[0440]y是0、1、2、3或4。[0441]术语“烷基”是指饱和脂族基团,包括直链烷基和支链烷基。在优选实施方案中,直链或支链烷基在其主链中具有6个或更少的碳原子(例如,直链为c1-c6,支链为c3-c6)。烷基包括甲基、乙基、丙基、异丙基、正丁基、异丁基、叔丁基、戊基、异戊基、己基等。[0442]术语“环烷基”是指环中具有3至6个碳的饱和碳环基团。环烷基包括环丙基、环丁基、环戊基和环己基。[0443]术语“双环基”是指具有两个连接的环系统的饱和碳环基团,所述环系统可以是稠合的或桥接的。双环基包括双环[2.1.1]己烷、双环[2.2.1]庚烷、十氢化萘等。术语“三环基”是指具有三个连接的环系统的饱和碳环基团,所述环系统可以是稠合的和/或桥接的。三环基包括金刚烷等。[0444]术语“烯基”是指具有至少一个碳-碳双键的不饱和脂族基团,包括直链烯基和支链烯基。在优选实施方案中,烯基具有二至六个碳原子(例如,c2-c6烯基)。[0445]如本文所用,术语“卤素”或“卤基”表示-f、-cl、-br或-i,并且优选地表示-f、-cl或-br。[0446]如本文所用,术语“烷氧基(alkoxyl)”或“烷氧基(alkoxy)”是指如上定义的通过氧原子连接的烷基。代表性烷氧基包括甲氧基、乙氧基、丙氧基、叔丁氧基等。[0447]术语“胺”和“氨基”是指未取代和取代的胺,例如可由以下通式表示的部分:[0448][0449]其中r和r'各自独立地选自h和c1-c3烷基。[0450]术语“酰胺基”是指未取代和取代的酰胺取代基,例如可由以下通式表示的部分:[0451][0452]其中r和r'各自独立地选自h和c1-c3烷基。[0453]术语“磺酰胺”或“磺酰胺基”是指未取代和取代的磺酰胺取代基,例如可由以下通式表示的部分:[0454][0455]其中r和r'各自独立地选自h和c1-c3烷基。[0456]如本文所用,术语“芳基”包括可包括零至四个杂原子的5元和6元单环芳族基团,例如苯、芘、吡咯、呋喃、噻吩、咪唑、噁唑、噻唑、三唑、吡唑、吡啶、吡嗪、哒嗪和嘧啶。那些在环结构中具有杂原子的芳基也可称为“芳基杂环”或“杂芳基”。术语“芳基”还包括具有两个或更多个环的多环系统,其中两个或更多个碳是两个相邻的环共有的(所述环是“稠环”),其中至少一个环是芳族环。因此,芳基包括8至10元稠合双环芳族基团,其可包括零至五个杂原子,其中一个或两个环是芳族环,例如萘、喹诺酮、异喹啉、苯并[b]噻吩、四氢萘等。每个芳基可未被取代的或可被1至5个选自以下的取代基取代:卤素、羟基、氨基、氰基、酰胺基、磺酰胺、硝基、-sh、c1-c6烷基、c2-c6烯基、c3-c7环烷基、c6-c10双环基、c1-c6卤烷基、c1-c6全卤烷基、-o-(c1-c6烷基)、o-(c3-c7环烷基)、-o-(c1-c6卤烷基)、-o-(c1-c6全卤烷基)、芳基、-o-芳基、-(c1-c6烷基)-芳基、-o-(c1-c6烷基)-芳基、-s-(c1-c6烷基)、-s-(c3-c7环烷基)、-s-(c1-c6卤烷基)、-s-(c1-c6全卤烷基)、-s-芳基、-s-(c1-c6烷基)-芳基、杂芳基和杂环基。[0457]术语“杂环”或“杂环基”是指具有1至3个环杂原子的非芳族杂环。优选的杂环是具有1至3个选自由o、n和s组成的组的杂原子的5元和6元杂环基团。[0458]如本文所用,术语“杂原子”意指除碳或氢之外的任何元素的原子。优选的杂原子是氮、氧和硫。[0459]如本文所用,当在任何结构中出现不止一次时,每个表述,例如烷基、r1、r2等的定义旨在独立于其在相同结构中的其它地方的定义。[0460]应理解,“取代”或“被取代”包括隐含的条件,即此类取代符合被取代原子和取代基的允许化合价,且所述取代得到稳定的化合物,例如不会自发进行转化(例如通过重排、环化、消除等)的化合物。[0461]本文公开的适体配体可以特定几何或立体异构形式以及其混合物存在。此类几何或立体异构形式包括但不限于顺式和反式异构体、r-和s-对映异构体、非对映异构体、(d)-异构体、(l)-异构体、它们的外消旋混合物以及它们的其它混合物。额外的不对称碳原子可存在于例如烷基的取代基中。[0462]根据式i至viii的化合物可含有酸性或碱性官能团,且因此可以盐形式存在。优选地,盐形式是药学上可接受的盐。在这方面,术语“药学上可接受的盐”是指本文公开的化合物的相对无毒的无机和有机酸和碱加成盐。[0463]根据式i至viii的化合物可含有一个或多个碱性官能团,例如氨基或烷基氨基,且因此能够与药学上可接受的酸形成药学上可接受的盐。这些盐可在施用媒剂或剂型制造过程中原位制备,或者通过单独使本文公开的游离碱形式的纯化化合物与合适的有机或无机酸反应,并在随后的纯化过程中分离由此形成的盐。代表性的盐包括氢溴酸盐、盐酸盐、硫酸盐、硫酸氢盐、磷酸盐、硝酸盐、乙酸盐、戊酸盐、油酸盐、棕榈酸盐、硬脂酸盐、月桂酸盐、苯甲酸盐、乳酸盐、磷酸盐、甲苯磺酸盐、柠檬酸盐、马来酸盐、富马酸盐、琥珀酸盐、酒石酸盐、萘酸盐、甲磺酸盐、葡庚糖酸盐、乳糖酸盐和月桂基磺酸盐等(参见例如berge等人(1977)"pharmaceuticalsalts",j.pharm.sci.66:1-19)。[0464]主题化合物的药学上可接受的盐包括化合物的常规无毒盐或季铵盐,例如来自无毒有机或无机酸的盐。例如,此类常规的无毒盐包括衍生自无机酸,例如盐酸、氢溴酸、硫酸、氨基磺酸、磷酸、硝酸等的盐;以及由有机酸,例如乙酸、丙酸、琥珀酸、乙醇酸、硬脂酸、乳酸、苹果酸、酒石酸、柠檬酸、抗坏血酸、棕榈酸、马来酸、羟基马来酸、、谷氨酸、苯甲酸、水杨酸、磺胺酸、2-乙酰氧基苯甲酸、富马酸、甲苯磺酸、甲磺酸、乙二磺酸、草酸、异硫磺酸等制备的盐。[0465]在其它情况下,根据式i至viii的化合物可含有一个或多个酸性官能团,且因此能够与药学上可接受的碱形成药学上可接受的盐。这些盐同样可在施用媒剂或剂型制造过程中原位制备,或者通过使纯化的游离酸形式的化合物与合适的碱(例如药学上可接受的金属阳离子的氢氧化物、碳酸盐或碳酸氢盐),与氨,或与药学上可接受的有机伯胺、仲胺或叔胺单独反应来制备。代表性的碱金属或碱土金属盐包括锂、钠、钾、钙、镁和铝盐等。可用于形成碱加成盐的代表性有机胺包括乙胺、二乙胺、乙二胺、乙醇胺、二乙醇胺、哌嗪等(参见例如berge等人,同上)。[0466]在实施方案中,本文提供的适体与本文提供的一种或多种硫胺或tpp类似物结合或以其它方式响应其存在,和/或与本文提供的硫胺或tpp类似物或衍生物的代谢物,包括例如tpp和/或硫胺结合或以其它方式作出响应。[0467]适体与其配体结合的特异性可根据与适体对于无关分子的解离常数相比的适体对于其配体的比较解离常数(kd)来定义。因此,配体是一种与适体结合的分子,其结合亲和力比与无关材料的亲和力更大。典型地,适体对于其配体的kd将比具有无关分子的适体的kd小至少约10倍。在其它实施方案中,kd将比具有无关分子的适体的kd小至少约20倍、小至少约50倍、小至少约100倍、以及小至少约200倍、小至少约500倍、小至少约1000倍或小至少约10,000倍。[0468]在一个实施方案中,适体以比所述适体对式i-vi1化合物或对醋糠硫胺、乙酰硫胺、蒜硫胺、氯硫胺、苯磷硫胺、苯甲硫胺、双苯甲硫胺、西托硫胺、赛可硫胺、呋喃硫胺、磷硫胺、奥托硫胺,丙舒硫胺、舒布硫胺或苯酰乙烯硫胺的亲和力低至少5倍、至少10倍、至少约20倍、至少50倍、至少100倍、至少500倍、至少1000倍或至少10,000倍的亲和力与tpp结合。在一个实施方案中,适体以比所述适体对式i-vi1化合物或对醋糠硫胺、乙酰硫胺、蒜硫胺、氯硫胺、苯磷硫胺、苯甲硫胺、双苯甲硫胺、西托硫胺、赛可硫胺、呋喃硫胺、磷硫胺、奥托硫胺,丙舒硫胺、舒布硫胺或苯酰乙烯硫胺的亲和力低至少5倍、至少10倍、至少约20倍、至少50倍、至少100倍、至少500倍、至少1000倍或至少10,000倍的亲和力与硫胺结合。[0469]调节基因表达的适体[0470]在一些实施方案中,本公开内容考虑的适体用于调节基因表达。调节靶基因(例如性转基因)的表达在多种情况下是有利的。例如,在基因性表达的背景下,能够响应小分子的存在而调节转基因表达的技术可通过调节靶基因表达水平以及其时机来提高安全性和功效。在研究环境中,基因表达的调节允许系统地研究不同的实验条件。[0471]在实施方案中,编码适体的序列是基因调节盒的一部分,其提供响应本文所述的小分子的存在或不存在而调节靶基因的表达水平的能力。在实施方案中,基因调节盒还包含靶基因。如本文所用,“靶基因”是指由于小分子与本文公开的适体结合而响应本文公开的小分子配体的存在或不存在而表达的转基因。在实施方案中,靶基因包含蛋白质(例如蛋白)、mirna或sirna的编码序列。靶基因与用于调节靶基因表达的适体异源,与用于调节靶基因的多核苷酸盒异源和/或与用于调节靶基因的多核苷酸盒的一部分异源。[0472]当用于响应配体的存在/不存在而调节靶基因的表达时,本文所述的适体可为多核苷酸盒的一部分,所述多核苷酸盒将适体编码为核糖开关的一部分。术语“基因调节盒”、“调节盒”或“多核苷酸盒”在本文中可互换使用。[0473]在实施方案中,与不存在小分子时靶基因的表达相比,与本文公开的适体结合的小分子的存在导致靶基因的表达增加。在此类实施方案中,适体构成“开启”开关。在实施方案中,与不存在小分子时相比,在存在与本文公开的适体结合的小分子时,靶基因的表达增加至少3倍、至少5倍、至少10倍、至少15倍、至少20倍、至少25倍、至少30倍、至少40倍、至少50倍、至少100倍、至少1000倍或至少10,000倍。在实施方案中,与不存在小分子时相比,在存在与本文公开的适体结合的小分子时,靶基因的表达增加2倍至10倍、5倍至10倍、5倍至15倍、5倍至20倍、5倍至25倍、5倍至30倍、10倍至20倍、10倍至30倍、10倍至40倍、10倍至50倍、10倍至100倍、10倍至500倍、10倍至1,000倍、50倍至100倍、50倍至500倍、50倍至100倍、50倍至1,000倍、100倍至1,000倍、或100倍至10,000倍。[0474]在实施方案中,与不存在小分子时靶基因的表达相比,与本文公开的适体结合的小分子的存在导致靶基因的表达减少。在此类实施方案中,适体构成“关闭”开关。在实施方案中,与不存在小分子时相比,在存在与本文公开的适体结合的小分子时,靶基因的表达减少至少3倍、至少5倍、至少10倍、至少15倍、至少20倍、至少25倍、至少30倍、至少40倍、至少50倍、至少100倍、至少1000倍或至少10,000倍。在一个实施方案中,与不存在小分子时相比,在存在与本文公开的适体结合的小分子时,靶基因的表达减少2倍至10倍、5倍至10倍、5倍至15倍、5倍至20倍、5倍至25倍、5倍至30倍、10倍至20倍、10倍至30倍、10倍至40倍、10倍至50倍、10倍至100倍、10倍至500倍、10倍至1,000倍、50倍至100倍、50倍至500倍、50倍至100倍、50倍至1,000倍、100倍至1,000倍、或100倍至10,000倍。[0475]在实施方案中,适体是核糖开关的一部分。核糖开关是rna多核苷酸的调节片段,其响应适体特异性配体分子的存在或不存在而调节rna多核苷酸的稳定性和/或调节从rna多核苷酸的蛋白质产生。在实施方案中,核糖开关包含传感区域(例如,适体区域)和效应区域,它们一起负责感知配体(例如,小分子)的存在并引起导致靶基因表达表达增加或减少的效应。本文所述的核糖开关是重组的,利用来自两个或多个来源的多核苷酸。在实施方案中,传感区域和效应区域通过多核苷酸接头连接。在实施方案中,多核苷酸接头形成rna茎或配对区域(即,双链的rna多核苷酸区域)。在实施方案中,将适体连接至效应区域的配对区域包含所有或一些适体茎(例如,所有或一些适体p1茎)。[0476]例如,包含适体序列的核糖开关可用于控制导致转录过早终止的rho非依赖性转录终止发夹的形成。包含适体序列的核糖开关还可诱导rna的结构变化,导致核糖体结合位点的隔离和翻译的抑制。包含本文公开的适体序列的选择性核糖开关结构可响应小分子配体的存在而进一步影响mrna剪接。[0477]选择性剪接核糖开关[0478]在一个实施方案中,本文所述的适体被编码为基因调节盒的一部分,用于通过适体/配体介导的所得rna(例如前mrna)的选择性剪接调节靶基因。在此情况下,基因调节盒包含核糖开关,所述核糖开关包含传感区域(例如,本文所述的适体)和效应区域,它们共同负责感知小分子配体的存在并改变与选择性外显子的剪接。剪接是指从新生的前信使rna(前mrna)中去除内含子序列并将外显子连接在一起形成mrna的过程。剪接位点是外显子与内含子之间的连接点,并且由内含子5'和3'端的不同共有序列定义(即分别为剪接供体和剪接受体位点)。剪接由称为剪接体的大型多组分结构进行,剪接体是小核核糖核蛋白(snrnp)和多种辅助蛋白的集合。通过识别各种顺式调节序列,剪接体定义外显子/内含子边界,去除内含子序列,并将外显子拼接成最终信息(例如,mrna)。在选择性剪接的情况下,可包括或排除某些外显子以改变最终的编码信息,从而改变所得表达的蛋白质。[0479]在一个实施方案中,通过使用wo2016/126747中公开的任何dna构建体来实现靶基因表达的调节,所述文献以引用方式整体并入本文。在本公开的实施方案中,wo2016/126747中公开的核糖开关和多核苷酸盒包含本文所述的适体编码序列以代替wo2016/126747中公开的适体序列。[0480]在一个实施方案中,多核苷酸盒包含(a)核糖开关和(b)选择性剪接的外显子,两侧为5'内含子和3'内含子,其中所述核糖开关包含(i)包含茎的效应区域,所述茎包括3'内含子的5'剪接位点序列,和(ii)本文公开的适体。在实施方案中,效应区域包含紧邻选择性外显子的3'的内含子的内含子5'剪接位点(“5'ss”)序列,以及与3′内含子的5'ss序列互补的序列。当适体结合其配体时,效应区域形成茎,且因此防止剪接至选择性外显子的3'端的剪接供体位点。在某些条件下(例如,当适体未与其配体结合时),效应区域位于提供进入选择性外显子的3'端的剪接供体位点的环境中,导致在靶基因mrna中包括选择性外显子。在一些实施方案中,将多核苷酸盒置于靶基因中以响应配体而调节靶基因表达。在一个实施方案中,选择性剪接的外显子包含终止密码子,当选择性剪接的外显子被剪接至靶基因mrna中时,所述终止密码子与靶基因同框。[0481]在一个实施方案中,基因调节盒包含seqidno:37,其中-x-代表本文公开的适体编码序列。小写字母表示将适体连接至核糖开关其余部分的成对茎序列。在一个实施方案中,选择性外显子(在以下seqidno:37中加下划线)被另一选择性外显子序列替换。[0482]seqidno:37-[0483]gtgagtctatgggacccttgatgttttctttccccttcttttctatggttaagttcatgtcataggaaggggagaagtaacagggtacacatattgaccaaatcagggtaattttgcatttgtaattttaaaaaatgctttcttcttttaatatacttttttgtttatcttatttctaatactttccctaatctctttctttcagggcaataatgatacaatgtatcatgccgagtaacgctgtttctctaacttgtaggaatgaattcagatatttccagagaatgaaaaaaaaatcttcagtagaaggtaatgt-x-acattacgcaccattctaaagaataacagtgataatttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgtaagaggtttcatattgctaatagcagctacaatccagctaccattctgcttttattttatggttgggataaggctggattattctgagtccaagctaggcccttttgctaatcatgttcatacctcttatcttcctcccacag。[0484]选择性外显子的两侧是5'和3'内含子序列。可用于本文公开的基因调节盒中的5'和3'内含子序列可为可从靶基因剪接,产生靶基因mrna或在mrna中包含选择性外显子的靶基因的任何序列,其取决于存在或不存在与适体结合的配体。5'和3'内含子序列各自具有发生剪接所必需的序列,即剪接供体、剪接受体和分支点序列。在一个实施方案中,基因调节盒的5'和3'内含子序列衍生自一个或多个天然存在的内含子或其部分。在一个实施方案中,5'和3'内含子序列衍生自截短的人β-珠蛋白内含子2(ivs2δ)、人03-珠蛋白基因的内含子2、sv40mrna内含子(用于来自clontechlaboratories,inc.的pcmv-lacz载体)、人磷酸丙糖异构酶(tpi)基因的内含子6(nottajit等人rna.2003,9:6070617)、人因子ix的内含子(sumikokurachi等人j.bio.chem.1995,270(10),5276)、靶基因自身的内源性内含子、或任何基因组片段或合成内含子(yilai等人humgenether.2006:17(10):1036),其含有足以进行调节剪接的元件(thomasa.cooper,methods2005(37):331)。[0485]在一个实施方案中,选择性外显子和核糖开关被工程化为位于靶基因的内源性内含子中。即,内含子(或基本相似的内含子序列)天然存在于靶基因的所述位置。在此情况下,紧邻选择性外显子上游的内含子序列称为5'内含子或5'内含子序列,并且紧邻选择性外显子下游的内含子序列称为3'内含子或3'内含子序列。在此情况下,内源性内含子被修饰以含有侧接选择性外显子的5'和3'端的剪接受体序列和剪接供体序列。在一个实施方案中,5'和/或3'内含子对于靶基因是外源的。[0486]选择性剪接基因调节盒中的剪接供体和剪接受体位点可被修饰以增强或减弱。也就是说,可通过标准克隆方法、定点诱变等将剪接位点修饰为更接近剪接供体或受体的共有序列。与剪接共有序列更相似的剪接位点倾向于促进剪接并因此得到增强。与剪接共有序列不太相似的剪接位点往往会阻碍剪接并因此被减弱。最常见的内含子类别(u2)的剪接供体的共有序列是a/cag∥gta/gagt(其中∥表示外显子/内含子边界)。剪接受体的共有序列是cag∥g(其中∥表示外显子/内含子边界)。本领域描述了剪接供体和受体位点处特定核苷酸的频率(参见例如zhang,m.q.,hummolgenet.1988.7(5):919-932)。可调整5'和3'剪接位点的强度以调节选择性外显子的剪接。[0487]可用于调节剪接的对存在于选择性剪接基因调节盒中的5′和3′内含子的额外修饰包括修饰、删除和/或添加内含子剪接增强子元件、内含子剪接抑制子元件和/或剪接位点,和/或修饰分支位点序列。[0488]在一个实施方案中,5'内含子已被修饰以含有将与靶基因同框的终止密码子。5'和3'内含子序列也可被修饰以去除隐藏的剪接位点,所述剪接位点可用公开可用的软件来识别(参见例如kapustin,y.等人.nucl.acidsres.2011.1-8)。[0489]可调整5'和3'内含子序列的长度,以便例如满足病毒表达构建体的大小要求。在一个实施方案中,5'和/或3'内含子序列的长度为约50至约300个核苷酸。在一个实施方案中,5'和/或3'内含子序列的长度为约125至约240个核苷酸。[0490]效应区域的茎部分应具有足够的长度(和gc含量),以在配体结合适体时基本上防止选择性外显子的选择性剪接,同时当配体以不足的量存在时也允许进入剪接位点。在实施方案中,除了3'内含子的5'剪接位点序列以及其5'剪接位点序列的互补序列之外,效应区域的茎部分还包含茎序列。在实施方案中,此额外茎序列包含来自适体茎的序列。可使用已知技术修饰茎部分的长度和序列,以鉴定在不存在配体时允许靶基因的可接受背景表达和在存在配体时允许靶基因的可接受表达水平的茎。在一个实施方案中,核糖开关的效应区域茎的长度为约7至约20个碱基对。在一个实施方案中,效应区域茎的长度为8至11个碱基对。除了茎的长度外,还可改变茎的gc碱基对含量以改变茎的稳定性。[0491]在一个实施方案中,作为本文公开的选择性剪接基因调节盒的一部分的选择性外显子是能够转录成前mrna和选择性剪接成靶基因的mrna的多核苷酸序列。在一个实施方案中,选择性外显子含有至少一个抑制翻译的序列,使得当选择性外显子包含在靶基因mrna中时,阻止或减少靶基因从所述mrna的表达。在优选实施方案中,当选择性外显子通过剪接包含在靶基因mrna中时,选择性外显子含有与靶基因同框的终止密码子(tga、taa、tag)。在实施方案中,除了终止密码子之外,或作为终止密码子的替代物,选择性外显子包含当选择性外显子通过剪接并入靶基因mrna中时减少或基本上阻止翻译的另一序列,所述靶基因mrna包括例如微rna结合位点,导致mrna降解。在一个实施方案中,选择性外显子包含导致mrna降解的mirna结合序列。在一个实施方案中,选择性外显子编码降低含有此多肽序列的蛋白质的稳定性的多肽序列。在一个实施方案中,选择性外显子编码引导含有此多肽序列的蛋白质降解的多肽序列。[0492]可通过改变外显子剪接增强子(ese)序列和外显子剪接抑制子(ess)序列和/或通过将ese或ess序列引入选择性外显子中来优化选择性外显子的基础或背景剪接水平。可使用本领域已知的方法,包括但不限于定点诱变来完成对选择性外显子的序列的此类改变。或者,可从商业来源获得所需序列的寡核苷酸(例如,包含选择性外显子的全部或部分)并克隆至基因调节盒中。ess和ese序列的鉴定可通过本领域已知的方法来完成,包括例如使用esefinder3.0(cartegni等人esefinder:awebresourcetoidentifyexonicsplicingenhancers.nucleicacidresearch,2003,31(13):3568-3571)和/或其它可用资源。[0493]在一个实施方案中,选择性外显子是天然存在的外显子。在另一实施方案中,选择性外显子衍生自已知外显子的全部或部分。在此上下文中,“衍生的”是指含有与天然存在的外显子或其一部分基本上同源但可含有各种突变的序列的选择性外显子,所述突变例如通过改变外显子剪接增强子(ese)序列和外显子剪接抑制子(ess)序列和/或通过将ese或ess序列引入选择性外显子中产生的突变。如本文所用,“同源性”和“同源”是指两个多核苷酸序列之间或两个多肽序列之间的同一性百分比。一个序列与另一序列之间的对应关系可通过本领域已知的技术来确定。例如,同源性可通过比对它们的序列和使用容易获得的计算机程序直接比较两个多肽分子来确定。或者,同源性可通过多核苷酸在同源区之间形成稳定双链体的条件下杂交,接着用单链特异性核酸酶消化,并确定消化片段的大小来确定。在与适当的插入或缺失最佳比对后,至少约80%、至少约85%、至少约90%和至少约95%的核苷酸或氨基酸分别在定义的分子长度上匹配(如使用上述方法测定)时,两个多核苷酸或两个多肽序列彼此“基本上同源”。[0494]在一个实施方案中,选择性外显子对于靶基因来说是外源的,尽管其可衍生自一个序列,所述序列源自靶基因将在其中表达的生物体。如本文所用,“外源”意指衍生自基因型不同的实体,所述实体不同于其所比较或引入或并入的实体的其余部分。例如,通过基因工程技术引入不同细胞类型中的多核苷酸是异源多核苷酸(并且在表达时可编码异源多肽)。在一个实施方案中,选择性剪接的外显子衍生自人二氢叶酸还原酶基因(dhfr)的外显子2、突变的人肾母细胞瘤1外显子5、小鼠钙/钙调蛋白依赖性蛋白激酶iiδ外显子16或sirt1外显子6。在实施方案中,选择性剪接外显子是或包含seqidno:79(gaatgaattcagatatttccagagaatgaaaaaaaaatcttcagtagaag)中修饰的dhfr外显子2。在实施方案中,选择性剪接的外显子是或包含seqidno:98gaatgaattcagatatttccagagaatgaaaaaaaatcttcagtagaag中修饰的dhfr外显子2。[0495]适体介导的自裂解核酶裂解[0496]在一个实施方案中,靶基因的适体介导的表达由适体介导的小核酸内切核酶的调节来调节。核酶是催化化学反应的rna酶。在本文公开的核酸和方法中,核酶可以是任何小核酸内切核酶,其将在包括但不限于以下的靶细胞类型中自裂解:锤头、发夹、丁型肝炎病毒、varkud卫星、扭曲、扭曲姊妹、手或手斧核酶。因此,在一个实施方案中,提供了一种核糖开关和一种包含核糖开关的基因表达盒,所述核糖开关含有与本文公开的适体连接的核酶。以引用方式整体并入本文中的wo2017/136608描述了在适体配体存在时活化核酶自裂解的核糖开关(“关闭”开关)或在适体存在时抑制核酶自裂解的核糖开关(“开启”开关)。[0497]在“关闭”开关场景中,适体/配体结合增加了核酶的核糖核酸酶功能,导致含有多核苷酸盒的靶基因rna被裂解,从而降低靶基因表达。此类开启开关的实例包括用于调节靶基因的表达的多核苷酸盒,所述多核苷酸盒包含核糖开关,所述核糖开关包含通过茎与连接适体的扭曲核酶,其中将扭曲核酶与适体连接的茎在扭曲核酶的p3茎的位置处附着于核酶,并且其中靶基因与扭曲核酶的p1茎连接(参见例如以引用方式并入本文中的wo2017/136608的图1a、1b或3a和相关文本)。[0498]在“开启”开关场景中,适体/配体结合抑制核酶的核糖核酸酶功能,减少含有多核苷酸盒的靶基因rna的裂解,从而在存在配体时增加靶基因表达。开启开关的实例包括核糖开关,其包含与适体连接的扭曲核酶,其中适体与扭曲核酶p1茎的3′或5′端连接,其中当适体与扭曲核酶p1茎的3'端连接时,扭曲核酶p1茎的3'臂的一部分或者是适体p1茎的5'臂,并且其中当适体与扭曲核酶p1茎的5'端连接时,扭曲核酶p1茎的5'臂的一部分或者是适体p1茎的3'臂(参见例如以引用方式并入本文中的wo2017/136608的图6a-6b,和相关文本)。[0499]聚腺苷酸化的适体调节[0500]在实施方案中,靶基因的表达受适体调节的聚腺苷酸化调节。几乎所有真核生物mrna的3'端都包含一个poly(a)尾,即20至250个腺苷残基的均聚物。由于向mrna添加poly(a)尾可保护其免于降解,因此可通过调节相应mrna的聚腺苷酸化来影响基因的表达。[0501]在一个实施方案中,靶基因的表达通过适体调节的聚腺苷酸化信号的可及性来调节,如以引用方式整体并入本文中的wo2018/156658中所述。在此类实施方案中,核糖开关包含本文所述的效应茎环和适体,其中效应茎环包含聚腺苷酸化信号,并且其中适体和效应茎环通过包含与适体茎的非共享臂和效应茎环的非共享臂互补的序列的选择性共享的茎臂连接(参见例如以引用方式并入本文中的wo2018/156658的图1a、1b、2a和5a和相关文本)。在一个实施方案中,效应茎环位于适体的3′处,使得选择性共享的茎臂包含3′适体茎臂的全部或一部分以及效应茎的5′臂的全部或一部分。在一个实施方案中,效应茎环位于适体的5′处,使得选择性共享的茎臂包含5′适体茎臂的全部或一部分以及效应茎的3′臂的全部或一部分。在一个实施方案中,聚腺苷酸化信号是aataaa或attaaa。在一个实施方案中,聚腺苷酸化信号是下游元件(dse)。在一个实施方案中,聚腺苷酸化信号是上游序列元件(use)。在一个实施方案中,多核苷酸盒包含两个核糖开关,其中第一核糖开关的效应茎环包含聚腺苷酸化信号aataaa或attaaa的全部或部分,并且第二核糖开关的效应茎环包含下游元件(dse)的全部或部分。在一个实施方案中,两个核糖开关各自包含结合相同配体的适体。在一个实施方案中,两个核糖开关包含结合不同配体的不同适体。[0502]在一些实施方案中,核糖开关包含传感区域(例如,本文所述的适体)和效应区域,所述效应区域包含作为剪接体的一部分的小核核糖核蛋白(snrnp)u1的结合位点。wo2017/136591描述了核糖开关,其中效应区域包含u1snrnp结合位点,并且以引用方式整体并入本文中。当适体结合其配体时,效应区域形成茎并隔离u1snrnp结合位点与u1snrnp的结合。在某些条件下(例如,当适体未与其配体结合时),效应区域位于提供进入u1snrnp结合位点的环境中,允许u1snrnp结合mrna并抑制聚腺苷酸化,从而导致信息降解。u1snrnp结合位点可为能够结合u1snrnp,从而将u1snrnp募集至靶基因的3′utr并抑制靶基因信息的聚腺苷酸化的任何多核苷酸序列。在一个实施方案中,u1snrnp结合位点是共有位点caggtaagta(seqidno:80)(cagguaagua,seqidno:81,当在mrna中时)。在一些实施方案中,u1snrnp结合位点是共有序列的变体,包括例如更短的序列或具有与共有序列不同的一个或多个核苷酸的序列。在一个实施方案中,u1snrnp结合位点含有序列caggtaag。在一些实施方案中,结合位点由选自caggtaagta(seqidno:80)、caggtaagt和caggtaag的序列编码。u1snrnp结合位点可为来自基因的任何5'剪接位点,例如来自人dhfr外显子2的5'剪接位点。[0503]适体介导的核糖核酸酶裂解调节[0504]在一个实施方案中,靶基因的表达通过适体调节的核糖核酸酶裂解来调节。核糖核酸酶(rna酶)识别并裂解特定的核糖核酸酶底物序列。本文提供了重组dna构建体,当其并入靶基因的dna中时,提供通过适体/配体介导的核糖核酸酶对所得rna的裂解来调节靶基因表达的能力。在一些实施方案中,本文所述的适体编码序列是构建体的一部分,所述构建体含有或编码核糖核酸酶底物序列和核糖开关,所述核糖开关包含效应区域和适体,使得当适体结合配体时,发生靶基因表达(如以引用方式整体并入本文中的wo2018/161053中所述)。在实施方案中,rna酶p底物序列与核糖开关连接,其中核糖开关包含本文所述的效应区域和适体,其中效应区域包含与rna酶p底物序列的一部分互补的序列。合适的配体与适体的结合诱导适体和效应区域的结构变化,改变核糖核酸酶底物序列对核糖核酸酶裂解的可及性。[0505]在一个实施方案中,适体序列位于rna酶p底物序列的5′处,并且效应区域包含rna酶p底物序列的全部或部分前导序列和全部或部分5′受体茎序列。参见例如以引用方式并入本文中的wo2018/161053的图1a、1b和3b和相关文本。在另外的实施方案中,rna酶p底物的受体茎和核糖开关效应区域被0、1、2、3或4个核苷酸分开。在其它实施方案中,除了前导序列(以及其互补序列)之外,效应区域茎还包括rna酶p底物的受体茎的一个或多个核苷酸,以及与受体茎的一个或多个核苷酸互补的序列。[0506]在一个实施方案中,多核苷酸盒的适体序列位于rna酶p底物序列的3′处,并且效应区域包含与rna酶p底物序列的3′受体茎的全部或部分互补的序列。参见例如以引用方式并入本文中的wo2018/161053的图3a和相关文本。在另外的实施方案中,与rna酶p底物的3′受体茎互补的效应区域序列为1至7个核苷酸。换句话说,效应区域茎包括受体茎的1至7个核苷酸并且包括与受体茎的这1至7个核苷酸互补的序列。在实施方案中,核糖开关位于rna酶p底物的3′处,因此rna酶p底物的效应区域茎和受体茎不重叠。在实施方案中,rna酶p底物的效应区域和受体茎紧邻(即,不重叠)。在其它实施方案中,效应区域和rna酶p底物的受体茎被1、2、3、4、5个或更多个核苷酸分开。[0507]本文公开的适体和基因调节盒可用于调节可在靶细胞、组织或生物体中表达的任何靶基因的表达。术语“靶基因”是指引入细胞中并能够在适当条件下转录成rna并翻译和/或表达的多核苷酸。或者,靶基因对于靶细胞是内源的,并且基因调节盒位于靶基因中(例如,位于内源靶基因的现有非翻译区或内含子中)。靶基因的一个实例是编码性多肽的多核苷酸。在一个实施方案中,靶基因对于要在其中转录重组dna构建体的细胞是外源的。在另一实施方案中,靶基因对于要在其中转录重组dna构建体的细胞是内源的。靶基因可为编码蛋白质的基因,或编码非蛋白质编码rna的序列。靶基因可为例如编码以下各者的基因:结构蛋白、酶、细胞信号传导蛋白、线粒体蛋白、锌指蛋白、激素、转运蛋白、生长因子、细胞因子、细胞内蛋白、细胞外蛋白、跨膜蛋白、细胞质蛋白、核蛋白、受体分子、rna结合蛋白、dna结合蛋白、转录因子、翻译机构、通道蛋白、运动蛋白、细胞粘附分子、线粒体蛋白、代谢酶、激酶、磷酸酶、交换因子、伴侣蛋白和这些中的任一者的调节剂。在实施方案中,靶基因编码红细胞生成素(epo)、人生长激素(hgh)、转录活化因子样效应核酸酶(talen)、人胰岛素、crispr相关蛋白9(cas9)或免疫球蛋白(或其部分),包括例如性抗体。[0508]在实施方案中,本文公开的适体和基因调节盒用于调节真核细胞,例如哺乳动物细胞并且更具体地人细胞中的靶基因的表达。在实施方案中,本文公开的适体和基因调节盒用于调节靶基因在眼睛(包括角膜和视网膜)、中枢神经系统(包括脑)、肝、肾、胰腺、心脏、气道、肌肉、皮肤、肺、软骨、睾丸、动脉、胸腺、骨髓或肿瘤中的表达。[0509]在一个方面,提供了重组载体以及其用于引入包含靶基因和基因调节盒的多核苷酸的用途,其中基因调节盒包含本文公开的适体。在一些实施方案中,重组dna构建体包括额外的dna元件,包括提供dna在宿主细胞中复制和在靶细胞中以适当水平表达靶基因的dna区段。普通技术人员理解表达控制序列(启动子、增强子等)是基于它们促进靶基因在靶细胞中表达的能力来选择的。“载体”意指重组质粒、酵母人工染体(yac)、微型染体、dna微型环或病毒(包括病毒衍生的序列),其包含要在体外或体内递送至宿主细胞中的多核苷酸。在一个实施方案中,重组载体是病毒载体或多种病毒载体的组合。[0510]用于在靶细胞、组织或生物体中表达靶基因的病毒载体是本领域已知的并且包括腺病毒(av)载体、腺相关病毒(aav)载体、逆转录病毒和慢病毒载体以及单纯疱疹1型(hsv1)载体。[0511]腺病毒载体包括例如基于人腺病毒2型和人腺病毒5型的那些,它们已经通过e1和e3区域的缺失而复制缺陷。转录盒可插入e1区域中,产生重组e1/e3耗尽的av载体。腺病毒载体还包括不含病毒编码序列的辅助依赖性高容量腺病毒载体(也称为高容量、“无肠(gutless)”或“有肠(gutted)”载体)。这些载体含有病毒dna复制和包装所需的顺式作用元件,主要是反向末端重复序列(itr)和包装信号(cy)。这些辅助依赖性av载体基因组有可能携带几百个碱基对直至大约36kb的外源dna。[0512]重组腺相关病毒“raav”载体包括衍生自任何腺相关病毒血清型的任何载体,包括但不限于aav-1、aav-2、aav-3、aav-4、aav-5、aav-7和aav-8、aav-9、aav-10等。raav载体可完全或部分缺失一个或多个aav野生型基因,优选rep和/或cap基因,但保留功能性侧接itr序列。保留功能性itr序列用于aav基因组的拯救、复制、包装和潜在染体整合。itr不必是野生型核苷酸序列,且可被改变(例如,通过核苷酸的插入、缺失或取代),只要所述序列提供功能性拯救、复制和包装即可。[0513]或者,可使用其它系统,例如慢病毒载体。基于慢病毒的系统可转导非分裂细胞以及分裂细胞,使其可用于针对例如cns的非分裂细胞的应用。慢病毒载体衍生自人免疫缺陷病毒,并且与所述病毒一样,整合至宿主基因组中,提供了非常长期的基因表达潜力。[0514]携带含有基因调节盒的靶基因的多核苷酸,包括质粒、yac、微染体和微环也可通过使用例如阳离子脂质、聚合物或两者作为载体的非病毒载体系统引入细胞或生物体中。共轭聚-l-赖氨酸(pll)聚合物和聚乙烯亚胺(pei)聚合物系统也可用于将载体递送至细胞。将载体递送至细胞的其它方法包括流体动力注射和电穿孔以及使用超声波,用于细胞培养以及生物体。有关用于基因递送的病毒和非病毒递送系统的综述,参见以引用方式并入本文中的nayerossadat,n.等人(advbiomedres.2012;1:27)。[0515]在一个方面,本公开提供了一种调节靶基因(例如,基因)的表达的方法,所述方法包括(a)将包含本文公开的适体的多核苷酸盒插入靶基因中,(b)将包含多核苷酸盒的靶基因引入细胞中,和(c)将细胞暴露于小分子配体,所述小分子配体以有效诱导靶基因表达的量特异性结合适体。在一些方面,靶基因在靶细胞中的表达赋予其所引入的细胞所需的特性,或以其它方式导致所需的结果。[0516]在一个实施方案中,将包含本文公开的适体的基因调节盒插入靶基因的蛋白质编码序列中(而不是插入5'或3'非翻译区中)。在一个实施方案中,将包含本文公开的适体的单个基因调节盒插入靶基因中。在其它实施方案中,将2、3、4或更多个基因调节盒插入靶基因中,其中一个或多个基因调节盒包含本文公开的适体。在一个实施方案中,将两个基因调节盒插入靶基因中,其中一个或两个基因调节盒包含本文公开的适体。当多个基因调节盒被插入一个靶基因中时,它们各自可含有相同适体,以使得单个配体可用于调节靶基因表达。在其它实施方案中,多个基因调节盒被插入靶基因中,各自可含有不同适体,以使得暴露于多个不同小分子配体可调节靶基因表达。[0517]方法和药物组合物[0518]在一个方面,提供了一种调节通过基因疗法递送的蛋白水平的方法。含有包含本文公开的适体的调节盒的基因序列例如通过载体递送至体内的靶细胞。靶基因表达的细胞特异性可由载体内的启动子和/或其它元件和/或病毒载体的衣壳控制。递送含有靶基因的载体构建体并转染靶组织,从而稳定转染调节的靶基因是产生蛋白的第一步。然而,由于靶基因序列内的适体,靶基因未以显著水平表达,即,在不存在与调节盒核糖开关内所含的适体结合的特定配体时,它处于“关闭状态”。仅当施用适体特异性配体时,靶基因表达才被活化。[0519]含有靶基因的载体构建体的递送和活化配体的递送通常在时间上分开。活化配体的递送将控制靶基因何时表达,以及蛋白质表达水平。配体可通过多种途径递送,包括但不限于玻璃体内、眼内、吸入、皮下、肌肉内、皮内、病灶内、局部、腹膜内、静脉内(iv)、动脉内、血管周围、脑内、脑室内、经口、舌下、唇下、经颊、经鼻、胸内、心内、鞘内、硬膜外、骨内或关节内。[0520]配体的递送时机将取决于活化靶基因的要求。例如,如果不断需要由靶基因编码的蛋白,则可每天或每天多次递送口服小分子配体,以确保靶基因的持续活化,且因此确保蛋白的持续表达。如果靶基因具有长效作用,则诱导配体的给药频率可较低,例如每周一次、每隔一周一次、每月一次。[0521]本文在包含核糖开关的基因调节盒的背景下描述的此适体允许性转基因的表达,以通过对适体特异的配体的时间给药确定的方式进行时间控制。性转基因仅在配体施用时表达,通过允许靶基因在不存在配体时关闭,增加了基因疗法的安全性。[0522]不同的适体可用于多个核糖开关,以允许不同的配体上调或下调靶基因的表达。在某些实施方案中,含有调节盒的每个基因将在盒内具有特定适体,所述适体将被特定小分子活化。这意味着每个基因只能被对其中所含的适体具有特异性的配体活化。在这些实施方案中,每个配体将仅活化一个基因。这允许几个不同的“靶基因”可被递送至一个个体,并且每个靶基因都将在递送包含于每个靶基因中所含的调节盒内的适体的特定配体时被活化。[0523]本文在核糖开关的上下文中公开的适体允许其基因可被递送至身体的任何蛋白(例如红细胞生成素(epo)或性抗体)在递送活化配体时由身体产生。此蛋白递送方法可替代在体外制造此类蛋白,接着将其注射或输注,例如用于癌症或阻断炎性或自身免疫疾病的抗体。含有调节靶基因的身体成为生物制剂制造工厂,所述工厂在施用基因特异性配体时启动。[0524]在一个实施方案中,靶蛋白可为可靶向和编辑特定dna序列的核酸酶。此类核酸酶包括cas9、含锌指的核酸酶或talen。在这些核酸酶的情况下,核酸酶蛋白可能只需要再足以编辑靶内源基因的短时间段内存在。然而,如果不受调节的核酸酶基因被递送至身体,则此蛋白质可能会在细胞的余生中一直存在。在核酸酶的情况下,核酸酶存在的时间越长,脱靶编辑的风险就越大。调节此类蛋白质的表达具有显著的安全优势。在此情况下,可将含有含调节盒的核酸酶靶基因的载体递送至体内的适当细胞。在不存在盒特异性配体时,靶基因处于“关闭”状态,因此不产生核酸酶。只有当施用活化配体时,才会产生核酸酶。当经过允许进行足够编辑的足够时间时,配体将被撤回并且不再施用。因此,核酸酶基因此后处于“关闭”状态,并且不再产生核酸酶,并且编辑停止。此方法可用于纠正遗传病,包括许多遗传性视网膜病,例如由cep290突变引起的lca10和由abca4突变引起的斯塔加兹氏病(stargardtsdisease)。[0525]施用编码仅在特定配体施用时活化的蛋白的调节靶基因可用于调节基因以许多不同类型的疾病,例如用抗体癌症;用免疫调节蛋白或抗体免疫病症;用抗c5抗体或抗体片段作为调节基因代谢疾病、罕见疾病,例如pnh;或用抗体眼部血管生成;以及用免疫调节蛋白干性amd。[0526]允许多种特定疾病和病况的多种特定靶基因适合用作可使用本文所述的适体/配体调节其表达的靶基因。例如,胰岛素或胰岛素类似物(优选人胰岛素或人胰岛素类似物)可用作i型糖尿病、ii型糖尿病或代谢综合征的靶基因;人生长激素可用作生长障碍儿童或生长激素缺乏的成人的靶基因;红细胞生成素(优选人红细胞生成素)可用作慢性肾病引起的贫血、骨髓发育不良引起的贫血或癌症化疗引起的贫血的靶基因。与本文公开的适体和基因表达盒相容的其它靶基因包括但不限于用于盲的环核苷酸门控阳离子通道α-3(cnga3)和环核苷酸门控阳离子通道β-3(cngb3)、用于素性视网膜炎或雷伯氏先天性黑蒙(leber’scongentialamaurosis)的类视黄醇异构水解酶(rpe65)、用于x连锁素性视网膜炎的x连锁素性视网膜炎gtp酶调节剂(rpgr)、包括用于帕金森氏病(parkinson'sdisease)的谷氨酸脱羧酶(gad)、用于肌萎缩侧索硬化症的无义转录物调节剂1(upf1)以及用于辐射引起的口干症和干燥综合征(sjogren’ssyndrome)的水通道蛋白。其它靶基因包括archt(来自盐红菌属(halorubrum)菌株tp009的古紫质)、jaws(衍生自盐沼盐盒菌(盐杆菌属)(haloarcula(halobacterium)salinarum)(鲨鱼菌株)的十字视紫红质(cruxhalorhodopsin))、ic1c2(来自莱茵衣藻(chlamydomonasreinhardtii)的通道视紫红质chr1与chr2之间的c1c2嵌合体的变体),或rgs9锚蛋白(r9ap),一种介导光转导级联失活的gtp酶复合物的关键组分。[0527]包含本文公开的适体的表达构建体可能尤其适用于由单基因缺陷引起的疾病,例如囊性纤维化、血友病、肌营养不良、地中海贫血或镰状细胞性贫血。因此,人β-、γ-、δ-或ζ-珠蛋白可用作β-地中海贫血或镰状细胞性贫血的靶基因;人因子viii或因子ix可用作血友病a或血友病b的靶基因。[0528]本文所述的小分子通常与一种或多种药学上可接受的载体组合以形成适合施用于患者的药物组合物。药学上可接受的载体包括通常用于制药领域的溶剂、粘合剂、稀释剂、崩解剂、润滑剂、分散介质、包衣、抗细菌剂和抗真菌剂、等渗剂和吸收延迟剂等。药物组合物可呈片剂、丸剂、胶囊、锭剂等形式,并且被配制成与它们的预期施用途径相容。施用途径的实例包括肠胃外,例如静脉内、皮内、鼻内、皮下、经口、吸入、经皮(局部)、经粘膜。[0529]将包含硫胺类似物或衍生物的药物组合物以给药方案施用于患者,使得足以理想地调节靶基因的量的硫胺类似物或衍生物被递送至患者。当剂型为片剂、丸剂等时,优选地,药物组合物包含0.1mg至10g硫胺类似物或衍生物、0.5mg至5g硫胺类似物或衍生物、1mg至1g硫胺类似物或衍生物、2mg至750mg硫胺类似物或衍生物、5mg至500mg硫胺类似物或衍生物、10mg至250mg硫胺类似物或衍生物、或150mg至300mg硫胺类似物或衍生物。[0530]药物组合物可每天给药一次或每天给药多次(例如,每天2、3、4、5次或更多次)。或者,药物组合物的给药频率可少于每天一次,例如每2、3、4、5、6、7、8、9、10、11、12、13或14天一次,或每月一次或每几个月一次。在一些实施方案中,药物组合物可仅向患者施用少量次,例如一次、两次、三次等。[0531]本文提供一种需要增加由靶基因编码的蛋白的表达的患者的方法,所述方法包括向患者施用包含配体的药物组合物,本文公开的适体与所述配体结合或以其它方式作出响应,其中所述患者先前已被施用包含靶基因的重组dna,并且其中靶基因含有本文公开的基因调节盒,所述基因调节盒提供通过适体的配体调节靶基因表达的能力。本文提供一种药物组合物,其包含配体,本文公开的适体与所述配体结合或以其它方式作出响应,用于需要增加由靶基因编码的蛋白的表达的患者的方法,其中所述患者先前已被施用包含靶基因的重组dna,并且其中靶基因含有本文公开的基因调节盒,所述基因调节盒提供通过适体的配体调节靶基因表达的能力。[0532]检测和/或诊断用途的适体[0533]广泛的检测和诊断试剂可通过嵌合或物理结合与适体连接。此外,适体可并入生物传感器、微流体装置和其它检测平台中。在一些实施方案中,适体结合至聚亚烷基二醇部分,包括但不限于聚乙二醇(peg)、聚丙二醇(ppg)、聚氧乙烯甘油(pog)和其它聚氧乙烯多元醇、聚乙烯醇(pva)和其它聚环氧烷、聚氧乙烯山梨糖醇或聚氧乙烯葡萄糖。[0534]在一些实施方案中,适体结合至可检测部分,包括但不限于荧光部分或标记、显像剂、放射性同位素部分、不透射线部分等,例如可检测标记如生物素、荧光团、发团、自旋共振探针、纳米颗粒(包括但不限于金、磁性和超顺磁性纳米颗粒)、量子点、放射性标记。示例性荧光团包括荧光染料(例如荧光素、罗丹明等)和其它发光分子(例如鲁米那)。荧光团可以是环境敏感的,使得如果它位于修饰的蛋白质中的在结合底物(例如丹磺酰基探针)时经历结构改变的一个或多个残基附近,则其荧光发生改变。示例性放射性标记包括含有具有一个或多个低灵敏度核(13c、15n、2h、125i、123i、99tc、43k、52fe、67ga、68ga、111in等)的原子的小分子。其它可用部分是本领域已知的。[0535]在一些实施方案中,适体结合至部分,包括但不限于抗炎剂、抗癌剂、抗神经变性剂、抗感染剂或通常的剂。[0536]鉴定与化合物结合的适体的方法[0537]本文公开了用于鉴定适体的方法,所述适体在核糖开关的一部分响应添加或暴露于感兴趣的化合物时与感兴趣的化合物(例如小分子,包括硫胺类似物、tpp类似物或其衍生物)结合或以其它方式调节靶基因表达。在一个实施方案中,方法包括以下步骤:[0538](i)选择亲本适体序列;[0539](ii)产生包含编码(i)中选择的适体的序列的适体文库,其中适体编码序列中的一个或多个核苷酸在对应于适体中的一个或多个未配对区域的一个或多个位置处随机突变,其中突变的适体序列在控制报告基因的表达的核糖开关的背景下;[0540](iii)针对与亲本适体序列相比,响应硫胺类似物而增加对所述靶基因表达的调节(例如,更高倍数的诱导或抑制)的适体筛选来自(ii)的文库;[0541](iv)任选地对在步骤(iii)中鉴定的适体而不是在步骤(i)中选择的适体重复步骤(ii)和(iii)。[0542]亲本适体序列可为tpp适体,包括已知的tpp适体序列,或可为通过在可用数据库中搜索同源序列而鉴定的推定tpp适体。亲本适体序列可为本文公开的适体序列。[0543]选择亲本适体序列的步骤可包括例如(i)鉴定推定tpp适体;(ii)将适体插入调节靶基因(例如报告基因)的表达的核糖开关中;以及(iii)将核糖开关/靶基因构建体暴露于硫胺或tpp类似物或衍生物(例如,本文所述的化合物)。[0544]推定tpp适体可从适当的序列数据库中识别,例如rfam数据库,它是rna家族的集合,每个家族都由多个序列比对、共有二级结构和协方差模型(cm)表示。在实施方案中,推定tpp适体从rfamtpp核糖开关家族rf00059中鉴定。在实施方案中,推定tpp适体具有与seqidno:94或seqidno:95(分别为具有茎的thic或thim适体)至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%同一的序列。[0545]seqidno:94:[0546]guaaugugucggagugccuuagggauuauuccccuaaagcugagaccgcauugcgggauccguugaaccugaucaggcuaauaccugcgaagggaacacauuac[0547]seqidno:95:[0548]guaaugucucggggugcccuucugcgugaaggcugagaaauacccguaucaccugaucuggauaaugccagcguagggaagacauuac[0549]可使用普通技术人员已知的技术将推定tpp适体插入核糖开关中。可在细胞培养物中和/或在无细胞系统中测试适体对tpp和一种或多种硫胺或tpp类似物或衍生物(例如本文所述的化合物)的存在的响应性。特别地,细胞培养系统是真核细胞培养物,包括例如哺乳动物、植物或昆虫细胞培养物。[0550]为了鉴定响应硫胺或tpp类似物或衍生物(例如本文所述的化合物)的适体,编码适体(即亲本适体)的序列的一个或多个核苷酸位置是随机的。可基于亲本适体序列的结构来选择用于随机化的核苷酸位置。预测的二级结构可使用可用程序,例如rnafold(http://rna.tbi.univie.ac.at/cgi-bin/rnawebsuite/rnafold.cgi)和/或通过与相关适体(例如,edwards,te&ferré‑d'amaré,ar,structure.2006年9月;14(9):1459-68的大肠杆菌thim核糖开关)的晶体结构的比较获得。例如,适体的未配对区域,包括环(l)区域(例如,l3和/或l5)和连接(j)区域(例如,j3-2(连接成对区域p3和p2)、j2-4和/或j4-5)可被鉴定,并且一个或多个未配对区域中的一个或多个核苷酸可被随机化以生成适体文库。在实施方案中,与一个或多个未配对区域相邻的一个或多个核苷酸是随机的。另外,成对(p)区域中的一个或多个核苷酸可为随机的。此外,可添加或删除未配对或配对区域中的一个或多个核苷酸。诱变的适体序列可作为核糖开关背景下的适体序列文库提供。在实施方案中,适体文库作为本文公开的基因表达盒的一部分在核糖开关的背景下提供。[0551]可测试含有一种或多种突变的适体编码序列对tpp或一种或多种硫胺或tpp类似物或衍生物的存在的响应性,如上所述。在实施方案中,含有一种或多种突变的适体响应于类似物或衍生物,但对硫胺和/或tpp的响应低于衍生其的亲本适体(在相同核糖开关/基因表达盒的情况下)。[0552]对所需化合物有反应的适体可通过随机化核苷酸进一步诱变。所选位置,例如未配对区域处的核苷酸可如上所述地随机化并创建文库。[0553]在一些实施方案中,感兴趣的化合物是硫胺类似物,例如醋糠硫胺、乙酰硫胺、蒜硫胺、氨丙啉、氯硫胺、苯磷硫胺、苯甲硫胺、双苯甲硫胺、西托硫胺、赛可硫胺、呋喃硫胺、磷硫胺、奥托硫胺、羟硫胺、丙舒硫胺、舒布硫胺或苯酰乙烯硫胺。在实施方案中,硫胺或tpp类似物是式i-viii的化合物,包括但不限于化合物m10-m99。在实施方案中,硫胺或tpp类似物是m10、m16、m18、m19、m21、m26、m27、m28、m29、m30、m31、m32、m33和m34之一。[0554]由本文公开的方法中使用的报告基因编码的报告蛋白是可通过检测报告蛋白的特征(例如酶活性或分光光度特征)或间接(例如使用基于抗体的分析)进行分析的蛋白质。可易于检测的报告基因产物的实例包括但不限于嘌呤霉素抗性标记(pac)、3-半乳糖苷酶、荧光素酶、乳清酸5'-磷酸脱羧酶(ura3)、精氨酸通透酶can1、半乳糖激酶(gal1)、β-半乳糖苷酶(lacz)或氯霉素乙酰转移酶(cat)。可检测信号的其它实例包括细胞表面标记,包括但不限于cd4。适用于本文公开的鉴定适体的方法的报告基因还包括荧光蛋白(例如,绿荧光蛋白(gfp)和其衍生物),或与荧光标签融合的蛋白质。荧光标签和蛋白质的实例包括但不限于(3-f)tyr-egfp、a44-kr、aacugfp1、aacugfp2、acegfp、acegfp-g222e-y220l、acegfp-h、acgfp1、adred、adred-c148s、aeurgfp、afragfp、alajgfp1、alajgfp2、alajgfp3、amcyan1、amfp486、amfp495、amfp506、amfp515、amilfp484、amilfp490、amilfp497、amilfp504、amilfp512、amilfp513、amilfp593、amilfp597、anm1gfp1、anm1gfp2、anm2cp、anobcfp1、anobcfp2、anobgfp、apulfp483、aq14、aq143、aquamarine、ascp562、asfp499、asred2、asulcp、atenfp、avgfp、avgfp454、avgfp480、avgfp509、avgfp510、avgfp514、avgfp523、azamigreen、azurite、bdfp1.6、bflogfpa1、bflogfpc1、bfp、bfp.a5、bfp5、bsdronpa(开)、ccalgfp1、ccalgfp3、ccalofp1、ccalrfp1、ccalyfp1、cegfp、cerfp505、cerulean、cfp、cfp484、cfsgfp2、cgfmkate2、cgfp、cgftagrfp、cgiggfp、cgregfp、chegfp1、chegfp2、chegfp4、citrine、citrine2、clomeleon、clover、cp-mkate、cpcitrine、cpt-sapphire174-173、cyofp1、cypet、cyrfp1(cyrfp1)、d-rfp618、d10、d1eosfp(绿)、d1eosfp(红)、d2eosfp(绿)、d2eosfp(红)、degfp1、degfp2、degfp3、degfp4、dendfp(绿)、dendfp(红)、dendra(绿)、dendra(红)、dendra2(绿)、dendra2(红)、dendra2-m159a(绿)、dendra2-m159a(橙)、dendra2-t69a(绿)、dendra2-t69a(橙)、dfgfp、dimer1、dimer2、dis2rfp、dis3gfp、dkeima、dkeima570、dlanyfp、drcbd、dreiklang(开)、dronpa(开)、dronpa-2(开)、dronpa-3(开)、dsfp483、dspr1、dsred、dsred-express、dsred-express2、dsred-max、dsred.m1、dsred.t3、dsred.t4、dsred2、dstc1、dtfp0.1、dtfp0.2、dtg、dtomato、dvfp、e2-crimson、e2-orange、e2-red/green、eagfp、ebfp、ebfp1.2、ebfp1.5、ebfp2、ecfp、ecfph148d、ecgfp、eechgfp1、eechgfp2、eechgfp3、eechrfp、efascfp、efasgfp、eforcp、egfp、egfp203c、egfp205c、emerald、enhancedcyan-emittinggfp、eosfp(绿)、eosfp(红)、eqfp578、eqfp611、eqfp611v124t、eqfp650、eqfp670、eyfp、eyfp-q69k、fabdgfp、ffdronpa(开)、foldingreportergfp、fp586、fprfl2.3、fr-1、fusionred、fusionred-m、g1、g2、g3、gamillus(开)、gamillus0.1、gamillus0.2、gamillus0.3、gamillus0.4、gcamp2、gfasgfp、gfp(s65t)、gfp-151pytyrcu、gfp-tyr151pyz、gfpmut2、gfpmut3、gfpxm16、gfpxm161、gfpxm162、gfpxm163、gfpxm18、gfpxm181uv、gfpxm18uv、gfpxm19、gfpxm191uv、gfpxm19uv、h9、hcred、hcred-tandem、hcred7、hcrigfp、hmgfp、hricfp、hrigfp、ifp1.4、ifp2.0、ilov、iq-ebfp2、iq-mapple、iq-mcerulean3、iq-memerald、iq-mkate2、iq-mvenus、irfp670、irfp682、irfp702、irfp713、irfp720、irisfp(绿)、irisfp(橙)、irisfp-m159a(绿)、jred、kaede(绿)、kaede(红)、katushka、katushka-9-5、katushka2s、kcy、kcy-g4219、kcy-g4219-38l、kcy-r1、kcy-r1-158a、kcy-r1-38h、kcy-r1-38l、kfp1(开)、kikgr1(绿)、kikgr1(红)、killerorange、killerred、ko、kohinoor(开)、laesgfp、lagfp、lanfp1、lanfp2、lanrfp-δs83l、lanyfp、larfp、lss-mkate1、lss-mkate2、lssmorange、m355na、mametrine、mapple、maroon0.1、mazamigreen、mbanana、mberfp、mblueberry1、mblueberry2、mc1、mc2、mc3、mc4、mc5、mc6、mcag1、mcag1ea、mcag2、mcardinal、mcarmine、mcavfp、mcavgfp、mcavrfp、mccfp、mcerulean、mcerulean.b、mcerulean.b2、mcerulean.b24、mcerulean2、mcerulean2.d3、mcerulean2.n、mcerulean2.n(t65s)、mcerulean3、mcherry、mcherry2、mcitrine、mclavgr2(绿)、mclavgr2(红)、mclover3、mcyrfp1、mecfp、meffcfp、meffgfp、meffrfp、megfp、melecfp、melerfp、memerald、meos2(绿)、meos2(红)、meos2-a69t(绿)、meos2-a69t(橙)、meos3.1(绿)、meos3.1(红)、meos3.2(绿)、meos3.2(红)、meos4a(绿)、meos4a(红)、meos4b(绿)、meos4b(红)、meosfp(绿)、meosfp(红)、meosfp-f173s(绿)、meosfp-f173s(红)、meosfp-m159a(绿)、meyfp、mfag1、mgarnet、mgarnet2、mgeos-c(开)、mgeos-e(开)、mgeos-f(开)、mgeos-l(开)、mgeos-m(开)、mgeos-s(开)、mginger1、mginger2、mgrape1、mgrape2、mgrape3、mhoneydew、micy、mifp、minisog、minisogq103v、minisog2、mirfp、mirfp670、mirfp670nano、mirfp670v1、mirfp703、mirfp709、mirfp720、mirisfp(绿)、mirisfp(红)、mk-go(早)、mk-go(晚)、mkalama1、mkate、mkatem41gs158c、mkates158a、mkates158c、mkate2、mkeima、mkelly1、mkelly2、mkg、mkikgr(绿)、mkikgr(红)、mkillerorange、mko、mko2、mkoκ、mlumin、mmaple(绿)、mmaple(红)、mmaple2(绿)、mmaple2(红)、mmaple3(绿)、mmaple3(红)、mmaroon1、mmgfp、mmicy、mmilcfp、mnectarine、mneongreen、mneptune、mneptune2、mneptune2.5、mneptune681、mneptune684、montiporasp.#20-9115、morange、morange2、moxbfp、moxcerulean3、moxdendra2(绿)、moxdendra2(红)、moxgfp、moxmaple3(绿)、moxmaple3(红)、moxneongreen、moxvenus、mpapaya、mpapaya0.7、mplum、mplum-e16p、mraspberry、mred7、mred7q1、mred7q1s1、mred7q1s1bm、mrfp1、mrfp1-q66c、mrfp1-q66s、mrfp1-q66t、mrfp1.1、mrfp1.2、mrojoa、mrojob、mrouge、mrtms5、mruby、mruby2、mruby3、mscarlet、mscarlet-h、mscarlet-i、mstable、mstrawberry、mt-sapphire、mtagbfp2、mtangerine、mtfp0.3、mtfp0.7(开)、mtfp1、mtfp1-y67w、mturquoise、mturquoise2、mugfp、mukg、mvenus、mvenus-q69m、mvfp、mvfp1、mwasabi、neptune、nijifp(绿)、nijifp(橙)、nowgfp、obecfp、obegfp、obeyfp、ofp、ofpxm、oxbfp、oxcerulean、oxgfp、oxvenus、p11、p4、p4-1、p4-3e、p9、pa-gfp(开)、padron(开)、padron(star)(开)、padron0.9(开)、pamcherry1(开)、pamcherry2(开)、pamcherry3(开)、pamkate(开)、patagrfp(开)、patagrfp1297(开)、patagrfp1314(开)、pcdronpa(绿)、pcdronpa(红)、pcdronpa2(绿)、pcdronpa2(红)、pdac1、pdae1gfp、phiyfp、phiyfpv、phluorin,ecliptic、phluorin,ecliptic(酸性)、phluorin,ratiometric(酸性)、phluorin,ratiometric(碱性)、phluorin2(酸性)、phluorin2(碱性)、phuji、plamgfp、pmeagfp1、pmeagfp2、pmimgfp1、pmimgfp2、pp2fbfp、pp2fbfpl30m、pplugfp1、pplugfp2、pporgfp、pporrfp、ps-cfp(青)、ps-cfp(绿)、ps-cfp2(青)、ps-cfp2(绿)、psamcfp、psmorange(远红)、psmorange(橙)、psmorange2(远红)、psmorange2(橙)、ptilgfp、r3-2+pcb、rcamp、rdsmcherry0.1、rdsmcherry0.2、rdsmcherry0.5、rdsmcherry1、rflogfp、rflorfp、rfp611、rfp618、rfp630、rfp637、rfp639、rogfp1、rogfp1-r1、rogfp1-r8、rogfp2、rrengfp、rrvt、rscherry(开)、rscherryrev(开)、rscherryrev1.4(开)、rsegfp(开)、rsegfp2(开)、rsfastlime(开)、rsfolder(绿)、rsfolder2(绿)、rsfusionred1(开)、rsfusionred2(开)、rsfusionred3(开)、rstagrfp(开)、sandercyanin、sapphire、sarcgfp、sbfp1、sbfp2、scfp1、scfp2、scfp3a、scfp3b、scubgfp1、scubgfp2、scubrfp、secbfp2、seyfp、sg11、sg12、sg25、sg42、sg50、sgfp1、sgfp2、sgfp2(206a)、sgfp2(e222q)、sgfp2(t65g)、shardonnay、shbfp、shbfp-n158s/l173i、shg24、sirius、siriusgfp、skylan-ns(开)、skylan-s(开)、smurfp、snifp、sopp、sopp2、sopp3、spoon(开)、stylgfp、superfoldergfp、superfoldermturquoise2、superfoldermturquoise2ox、supernovagreen、supernovared、syfp2、t-sapphire、tagbfp、tagcfp、taggfp、taggfp2、tagrfp、tagrfp-t、tagrfp657、tagrfp675、tagyfp、td-rfp611、td-rfp639、tdimer2(12)、tdkatushka2、tdsmurfp、tdtomato、tkeima、topaz、turbogfp、turbogfp-v197l、turborfp、turquoise-gl、ultramarine、unag、usgfp、venus、vfp、vsfgfp-0、vsfgfp-9、w1c、w2、w7、wascfp、wi-phy、ypet、zfp538、zoan2rfp、zsgreen、zsyellow1、αgfp、10b、22g、5b、6c、a1a、aacucp、acanfp、ahyacp、amilcp、amilcp580、amilcp586、amilcp604、apulcp584、bfpsol、blue102、cfp4、cgigcp、chegfp3、clover1.5、cpascp、cy11.5、dclavgr1.6、dclover2、dclover2a206k、dhorgfp、dhorrfp、dpapaya0.1、dronpa-c62s、dsred-timer、echfp、echifp、eyfp-f46l、fcfp、fcomfp、fpaagar、fpag_frag、fpcondchrom、fpmann、fpmcavgr7.7、gamillus0.5、gdjicp、gfascp、gfphal、gtencp、hcricp、hfrifp、kikg、lea、mcfp497、mcfp503、mcfp506、mcherry1.5、mclavgr1、mclavgr1.1、mclavgr1.8、mclover1.5、mcrfp、meffcp、meos2-na、merufp、mkate2.5、mofp.t.12、mofp.t.8、montfp、moxeos3.2、mpa-gfp、mpapaya0.3、mpapaya0.6、mrfp1.3、mrfp1.4、mrfp1.5、mtfp0.4、mtfp0.5、mtfp0.6、mtfp0.8、mtfp0.9、mtfp1-y67h、mturquoise-146g、mturquoise-146s、mturquoise-dr、mturquoise-gl、mturquoise-gv、mturquoise-ra、mturquoise2-g、npr3784g、pdm1-4、psupfp、q80r、rflogfp2、rpbphp1、rpbphp2、rpbphp6、rrgfp、rsgfp1、rsgfp2、rsgfp3、rsgfp4、rsgfp6、rsgfp7、rtms5、sclefp1、sclefp2、spiscp、stylcp、sympfp、teapcα、tpapaya0.01、trp-lessgfp、vsgfp、xpa、yegfp、yfp3、zgfp和zrfp。[0555]用于筛选本文公开的适体文库的方法可包括测量在适体控制下的报告基因的活性和/或比较报告基因在存在用于筛选的硫胺或tpp类似物的情况下的活性与报告基因在不存在用于筛选的硫胺或tpp类似物的情况下的活性。[0556]制品和试剂盒[0557]还提供了用于本文所述方法的试剂盒或制品。在一些方面,试剂盒包含在合适包装中的本文所述的组合物(例如,用于递送包含含有基因调节盒的靶基因的载体的组合物)。本文所述的组合物(例如用于注射的眼用组合物)的合适包装是本领域已知的,并且包括例如小瓶(例如密封的小瓶)、容器、安瓿、瓶子、罐子、软包装(例如密封的聚酯薄膜或塑料袋)等。这些制品可被进一步灭菌和/或密封。[0558]还提供了包含本文所述的组合物的试剂盒。这些试剂盒还可包含关于使用组合物的方法,例如本文所述的用途的说明书。本文所述的试剂盒还可包括从商业和用户的角度看所需的其它材料,包括缓冲剂、稀释剂、过滤器、针头、注射器和包装说明书,其中带有关于执行组合物的施用或执行本文所述的任何方法的说明。例如,在一些实施方案中,试剂盒包含用于表达靶基因的raav,所述靶基因包含含有本文所述的适体序列的基因调节盒;适用于注射的药学上可接受的载体;和以下中的一种或多种:缓冲剂、稀释剂、过滤器、针头、注射器和带有关于执行注射的说明的包装说明书。在一些实施方案中,试剂盒适用于眼内注射、肌内注射、静脉内注射等。[0559]应当理解和预期,本领域技术人员可对本文所公开的物质组成和方法进行改变,并且旨在将此类修改包括于本公开的范围内。以下实施例进一步说明本发明,但不应解释为以任何方式限制本发明的范围。[0560]本文引用的所有参考文献均以引用方式整体并入本文中。除非另有说明,否则本文提供的所有核苷酸序列均呈5′至3′方向。在此提交了序列表,其内容以引用方式整体并入本文中。[0561]实施例[0562]实施例1.包含硫胺焦磷酸(tpp)响应性适体的合成核糖开关可响应tpp和硫胺类似物而调节基因表达[0563]实验程序[0564]核糖开关构建体:适体由integrateddnatechnologies,inc.合成,并使用goldengate克隆策略(newenglandbiolabs,neb)将合成的适体序列克隆至内含子-外显子-内含子盒中,以用来自大不里士别样希瓦氏菌(alishewanellatabrizica)thic基因的tpp适体(microbiolres.2017年1月;195:71-80)或来自大肠杆菌(escherichiacoli)thim基因的tpp适体(structure.2006年9月;14(9):1459-68)替换g17核糖开关盒中的鸟嘌呤适体(参见整体并入本文中的wo2016/126747中列举的seqidno:15),分别产生核糖开关tppz和tppm。[0565]seqidno:82是通过将tppz核糖开关插入荧光素酶报告基因而获得的。大写字母表示荧光素酶编码序列。小写字母表示内含子/选择性外显子/内含子和核糖开关序列。thic适体编码序列(seqidno:96)加下划线。在一个实施方案中,提供了一种包含seqidno:82的核糖开关,其中seqidno:82中的适体编码序列(seqidno:96)被本文公开的另一适体序列替换。[0566]seqidno:82[0567]atggaagacgccaaaaacataaagaaaggcccggcgccattctatccgctggaagatggaaccgctggagagcaactgcataaggctatgaagagatacgccctggttcctggaacaattgcttttacagatgcacatatcgaggtggacatcacttacgctgagtacttcgaaatgtccgttcggttggcagaagctatgaaacgatatgggctgaatacaaatcacagaatcgtcgtatgcagtgaaaactctcttcaattctttatgccggtgttgggcgcgttatttatcggagttgcagttgcgcccgcgaacgacatttataatgaacgtgaattgctcaacagtatgggcatttcgcagcctaccgtggtgttcgtttccaaaaaggggttgcaaaaaattttgaacgtgcaaaaaaagctcccaatcatccaaaaaattattatcatggattctaaaacggattaccagggatttcagtcgatgtacacgttcgtcacatctcatctacctcccggttttaatgaatacgattttgtgccagagtccttcgatagggacaagacaattgcactgatcatgaactcctctggatctactggtctgcctaaaggtgtcgctctgcctcatagaactgcctgcgtgagattctcgcatgccagagatcctatttttggcaatcaaatcattccggatactgcgattttaagtgttgttccattccatcacggttttggaatgtttactacactcggatatttgatatgtggatttcgagtcgtcttaatgtatagatttgaagaagagctgtttctgaggagccttcaggattacaagattcaaagtgcgctgctggtgccaaccctattctccttcttcgccaaaagcactctgattgacaaatacgatttatctaatttacacgaaattgcttctggtggcgctcccctctctaaggaagtcggggaagcggttgccaagaggttccatctgccaggtatcagggtgagtctatgggacccttgatgttttctttccccttcttttctatggttaagttcatgtcataggaaggggagaagtaacagggtacacatattgaccaaatcagggtaattttgcatttgtaattttaaaaaatgctttcttcttttaatatacttttttgtttatcttatttctaatactttccctaatctctttctttcagggcaataatgatacaatgtatcatgccgagtaacgctgtttctctaacttgtaggaatgaattcagatatttccagagaatgaaaaaaaaatcttcagtagaaggtaatgtgtcggagtgccttagggattattcccctaaagctgagaccgcattgcgggatccgttgaacctgatcaggctaatacctgcgaagggaacacattacgcaccattctaaagaataacagtgataatttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgtaagaggtttcatattgctaatagcagctacaatccagctaccattctgcttttattttatggttgggataaggctggattattctgagtccaagctaggcccttttgctaatcatgttcatacctcttatcttcctcccacagcaaggatatgggctcactgagactacatcagctattctgattacacccgagggggatgataaaccgggcgcggtcggtaaagttgttccattttttgaagcgaaggttgtggatctggataccgggaaaacgctgggcgttaatcaaagaggcgaactgtgtgtgagaggtcctatgattatgtccggttatgtaaacaatccggaagcgaccaacgccttgattgacaaggatggatggctacattctggagacatagcttactgggacgaagacgaacacttcttcatcgttgaccgcctgaagtctctgattaagtacaaaggctatcaggtggctcccgctgaattggaatccatcttgctccaacaccccaacatcttcgacgcaggtgtcgcaggtcttcccgacgatgacgccggtgaacttcccgccgccgttgttgttttggagcacggaaagacgatgacggaaaaagagatcgtggattacgtcgccagtcaagtaacaaccgcgaaaaagttgcgcggaggagttgtgtttgtggacgaagtaccgaaaggtcttaccggaaaactcgacgcaagaaaaatcagagagatcctcataaaggccaagaagggcggaaagatcgccgtgtaa[0568]seqidno:83是通过将tppm核糖开关插入荧光素酶报告基因而获得的。大写字母表示荧光素酶编码序列。小写字母表示内含子/选择性外显子/内含子和核糖开关序列。thim适体编码序列(seqidno:97)加下划线。在一个实施方案中,提供了一种包含seqidno:83的核糖开关,其中seqidno:83中的适体编码序列(seqidno:97)被本文公开的另一适体序列替换。[0569]seqidno:83[0570]atggaagacgccaaaaacataaagaaaggcccggcgccattctatccgctggaagatggaaccgctggagagcaactgcataaggctatgaagagatacgccctggttcctggaacaattgcttttacagatgcacatatcgaggtggacatcacttacgctgagtacttcgaaatgtccgttcggttggcagaagctatgaaacgatatgggctgaatacaaatcacagaatcgtcgtatgcagtgaaaactctcttcaattctttatgccggtgttgggcgcgttatttatcggagttgcagttgcgcccgcgaacgacatttataatgaacgtgaattgctcaacagtatgggcatttcgcagcctaccgtggtgttcgtttccaaaaaggggttgcaaaaaattttgaacgtgcaaaaaaagctcccaatcatccaaaaaattattatcatggattctaaaacggattaccagggatttcagtcgatgtacacgttcgtcacatctcatctacctcccggttttaatgaatacgattttgtgccagagtccttcgatagggacaagacaattgcactgatcatgaactcctctggatctactggtctgcctaaaggtgtcgctctgcctcatagaactgcctgcgtgagattctcgcatgccagagatcctatttttggcaatcaaatcattccggatactgcgattttaagtgttgttccattccatcacggttttggaatgtttactacactcggatatttgatatgtggatttcgagtcgtcttaatgtatagatttgaagaagagctgtttctgaggagccttcaggattacaagattcaaagtgcgctgctggtgccaaccctattctccttcttcgccaaaagcactctgattgacaaatacgatttatctaatttacacgaaattgcttctggtggcgctcccctctctaaggaagtcggggaagcggttgccaagaggttccatctgccaggtatcagggtgagtctatgggacccttgatgttttctttccccttcttttctatggttaagttcatgtcataggaaggggagaagtaacagggtacacatattgaccaaatcagggtaattttgcatttgtaattttaaaaaatgctttcttcttttaatatacttttttgtttatcttatttctaatactttccctaatctctttctttcagggcaataatgatacaatgtatcatgccgagtaacgctgtttctctaacttgtaggaatgaattcagatatttccagagaatgaaaaaaaaatcttcagtagaaggtaatgtctcggggtgcccttctgcgtgaaggctgagaaatacccgtatcacctgatctggataatgccagcgtagggaagacattacgcaccattctaaagaataacagtgataatttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgtaagaggtttcatattgctaatagcagctacaatccagctaccattctgcttttattttatggttgggataaggctggattattctgagtccaagctaggcccttttgctaatcatgttcatacctcttatcttcctcccacagcaaggatatgggctcactgagactacatcagctattctgattacacccgagggggatgataaaccgggcgcggtcggtaaagttgttccattttttgaagcgaaggttgtggatctggataccgggaaaacgctgggcgttaatcaaagaggcgaactgtgtgtgagaggtcctatgattatgtccggttatgtaaacaatccggaagcgaccaacgccttgattgacaaggatggatggctacattctggagacatagcttactgggacgaagacgaacacttcttcatcgttgaccgcctgaagtctctgattaagtacaaaggctatcaggtggctcccgctgaattggaatccatcttgctccaacaccccaacatcttcgacgcaggtgtcgcaggtcttcccgacgatgacgccggtgaacttcccgccgccgttgttgttttggagcacggaaagacgatgacggaaaaagagatcgtggattacgtcgccagtcaagtaacaaccgcgaaaaagttgcgcggaggagttgtgtttgtggacgaagtaccgaaaggtcttaccggaaaactcgacgcaagaaaaatcagagagatcctcataaaggccaagaagggcggaaagatcgccgtgtaa[0571]转染:转染前一天,将3.5×104个人胚肾(hek)293细胞接种在96孔平底板中。将质粒dna(500ng)添加至管或96孔u型底板中。另外,将transit-293试剂(mirus;1.4μl)添加至50μloptimemi培养基(lifetechnologies)中,并在室温(rt)下静置5分钟。接着,将50μl这种稀释的转染试剂添加至dna中,混合并在rt下培育20分钟。最后,将7μl这种溶液添加至96孔板的一个细胞孔中。转染后四小时,将含有转染溶液的培养基更换为含有tpp、呋喃硫胺、丙舒硫胺、双苯甲硫胺、盐酸氯硫胺或舒布硫胺作为适体诱导剂的培养基。[0572]培养细胞的萤火虫荧光素酶分析:更换培养基后二十四小时,将板从培养箱中取出,并在实验室工作台上平衡至rt后维持几分钟,接着吸出。添加glo-lysis缓冲液(promega,100μl,rt),且使板在rt下保持至少5分钟。接着,孔内容物通过50μl湿磨混合,且将20μl每个样品与20μl在glo-lysis缓冲液中稀释至10%的bright-glo试剂(promega)混合。96个孔分布在不透明的白384孔板上。在室温下培育5分钟后,使用读取时间为500ms的tecan机器测量发光。荧光素酶活性表示为平均任意光单位(alu)±s.d.,且诱导倍数计算为从用tpp或类似物处理的细胞获得的荧光素酶活性除以从未用tpp或类似物处理的细胞获得的荧光素酶活性的商。[0573]结果[0574]通过将来自大不里士别样希瓦氏菌thic核糖开关(用于核糖开关tppz)或大肠杆菌thim核糖开关(用于核糖开关tppm)的tpp适体分别插入合成核糖开关基因表达盒中,产生包含tpp响应性核糖开关的基因表达盒。此处,将适体序列插入至含有框内终止密码子的选择性外显子下游的内含子中,如以引用方式整体并入本文中的wo2016/126747中所述。与适体结合的配体控制3′内含子的5′剪接位点的可及性,因此允许通过调节选择性剪接来调节靶基因的表达。[0575]如图1a中所示,合成核糖开关tppz和tppm均响应tpp而调节荧光素酶表达。tppz在比tppm更低的浓度下诱导靶基因表达,表明与大肠杆菌thim适体相比,大不里士别样希瓦氏菌thic适体在哺乳动物细胞中具有更高的tpp结合亲和力。[0576]为了确定合成核糖开关tppz和tppm是否也响应硫胺类似物,调查了一组硫胺类似物。如图1b和图1c中所示,tppz和tppm均响应呋喃硫胺和丙舒硫胺处理而诱导荧光素酶表达,而用双苯甲硫胺、盐酸氯硫胺和舒布硫胺处理导致对荧光素酶表达的影响较弱或没有影响(参见图1d)。在所有情况下,核糖开关tppz均以低于tppm的浓度诱导靶基因表达。[0577]这些数据表明,包含异源适体序列的合成核糖开关可响应多种硫胺相关分子而在哺乳动物细胞中以剂量依赖性方式有效诱导靶基因表达。[0578]实施例2.tpp适体同源序列响应硫胺类似物而调节哺乳动物细胞中的基因表达。[0579]实验程序:[0580]核糖开关构建:tpp适体同源序列获自rfam12.0(https://rfam.xfam.org/)并进行合成(twisterbiotech)。为了制备含有tpp适体同源序列的核糖开关构建体,合成的寡核苷酸用作pcr模板并使用goldengate克隆(neb)替换g17核糖开关构建体中的鸟嘌呤适体(wo2016/126747)。[0581]如实施例1中所述地进行转染和萤火虫荧光素酶分析。[0582]结果:[0583]对于用于目的,例如在人受试者中的基因调节,将合成核糖开关与天然不存在于待的受试者中的合成化合物(例如呋喃硫胺)组合使用是特别有用的。这是因为患者体内不存在调节化合物,允许严格控制基因的表达。[0584]为了鉴定与tppz和tppm相比具有更高的响应硫胺类似物的基因调节活性的适体,从rfam12.0(rna家族数据库rf00059,http://rfam.xfam.org/family/rf00059)获得具有同源序列的推定tpp适体。将此推定tpp适体(登录号aacy023654033.1,序列在位置895开始且在位置815结束;本文中称为14g4)插入至基于选择性剪接的基因调节盒中,如实施例1中所述,以产生适体核糖开关14g4。[0585]seqidno:84是通过将14g4核糖开关插入荧光素酶报告基因而获得的。大写字母表示荧光素酶编码序列。小写字母表示内含子/选择性外显子/内含子和核糖开关序列。14g4适体编码序列(seqidno:7)加下划线。在一个实施方案中,提供了一种包含seqidno:84的核糖开关,其中seqidno:84中的适体编码序列(seqidno:7)被本文公开的另一适体序列替换。[0586]seqidno:84[0587]atggaagacgccaaaaacataaagaaaggcccggcgccattctatccgctggaagatggaaccgctggagagcaactgcataaggctatgaagagatacgccctggttcctggaacaattgcttttacagatgcacatatcgaggtggacatcacttacgctgagtacttcgaaatgtccgttcggttggcagaagctatgaaacgatatgggctgaatacaaatcacagaatcgtcgtatgcagtgaaaactctcttcaattctttatgccggtgttgggcgcgttatttatcggagttgcagttgcgcccgcgaacgacatttataatgaacgtgaattgctcaacagtatgggcatttcgcagcctaccgtggtgttcgtttccaaaaaggggttgcaaaaaattttgaacgtgcaaaaaaagctcccaatcatccaaaaaattattatcatggattctaaaacggattaccagggatttcagtcgatgtacacgttcgtcacatctcatctacctcccggttttaatgaatacgattttgtgccagagtccttcgatagggacaagacaattgcactgatcatgaactcctctggatctactggtctgcctaaaggtgtcgctctgcctcatagaactgcctgcgtgagattctcgcatgccagagatcctatttttggcaatcaaatcattccggatactgcgattttaagtgttgttccattccatcacggttttggaatgtttactacactcggatatttgatatgtggatttcgagtcgtcttaatgtatagatttgaagaagagctgtttctgaggagccttcaggattacaagattcaaagtgcgctgctggtgccaaccctattctccttcttcgccaaaagcactctgattgacaaatacgatttatctaatttacacgaaattgcttctggtggcgctcccctctctaaggaagtcggggaagcggttgccaagaggttccatctgccaggtatcagggtgagtctatgggacccttgatgttttctttccccttcttttctatggttaagttcatgtcataggaaggggagaagtaacagggtacacatattgaccaaatcagggtaattttgcatttgtaattttaaaaaatgctttcttcttttaatatacttttttgtttatcttatttctaatactttccctaatctctttctttcagggcaataatgatacaatgtatcatgccgagtaacgctgtttctctaacttgtaggaatgaattcagatatttccagagaatgaaaaaaaaatcttcagtagaaggtaatgtacaggggtccggccttttcatttggcgccggtgagagcacaccctttgaacctgtttacggataatgccgccgcagggagtacattacgcaccattctaaagaataacagtgataatttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgtaagaggtttcatattgctaatagcagctacaatccagctaccattctgcttttattttatggttgggataaggctggattattctgagtccaagctaggcccttttgctaatcatgttcatacctcttatcttcctcccacagcaaggatatgggctcactgagactacatcagctattctgattacacccgagggggatgataaaccgggcgcggtcggtaaagttgttccattttttgaagcgaaggttgtggatctggataccgggaaaacgctgggcgttaatcaaagaggcgaactgtgtgtgagaggtcctatgattatgtccggttatgtaaacaatccggaagcgaccaacgccttgattgacaaggatggatggctacattctggagacatagcttactgggacgaagacgaacacttcttcatcgttgaccgcctgaagtctctgattaagtacaaaggctatcaggtggctcccgctgaattggaatccatcttgctccaacaccccaacatcttcgacgcaggtgtcgcaggtcttcccgacgatgacgccggtgaacttcccgccgccgttgttgttttggagcacggaaagacgatgacggaaaaagagatcgtggattacgtcgccagtcaagtaacaaccgcgaaaaagttgcgcggaggagttgtgtttgtggacgaagtaccgaaaggtcttaccggaaaactcgacgcaagaaaaatcagagagatcctcataaaggccaagaagggcggaaagatcgccgtgtaa[0588]在hek293细胞中测试了此核糖开关调节荧光素酶基因表达的能力。如图2中所示,荧光素酶表达在用呋喃硫胺处理后以剂量依赖性方式增加了100倍。此外,14g4核糖开关响应多种类型细胞中的呋喃硫胺处理而调节荧光素酶基因表达。[0589]此实验说明哺乳动物核糖开关的成功产生,所述核糖开关包含能够响应合成小分子而在哺乳动物细胞中显著诱导靶基因表达的适体。[0590]实施例3.产生包含对硫胺类似物具有增加的敏感性的再工程化适体序列的核糖开关。[0591]选择核糖开关14g4进行进一步改进,因为与tpp相比,它对呋喃硫胺具有选择性。在比较14g4核糖开关的预测二级结构(rnafold,http://rna.tbi.univie.ac.at/cgi-bin/rnawebsuite/rnafold.cgi)与大肠杆菌thim核糖开关的晶体学结构后,鉴定了14g4序列中的三个区域,它们似乎不参与螺旋形成,但可能参与配体结合后的三级结构。选择这三个区域进行序列随机化,以产生具有活性提高的再工程化适体序列的核糖开关。[0592]通过分别在区域j4-5、j2-4和j3-2中或附近的6个位置随机化核苷酸产生三个适体文库a1、a2和a3(参见图3)。挑选单个细菌菌落,并在hek293细胞中筛选含有核糖开关构建体的质粒,所述核糖开关构建体与核糖开关14g4相比,响应50μm呋喃硫胺的基因调节活性有所提高。如图4a中所示,与亲本构建体14g4相比,分离的若干适体构建体,包括1d10、3h4、4h2、6b4、6c4和6g12显示出呋喃硫胺依赖性诱导的增加。这些包含再工程化适体序列的核糖开关还导致其它细胞类型中靶基因表达的显著增强,所述细胞类型包括α小鼠肝脏12(aml12)、c2c12(鼠成肌细胞系)和成人视网膜素上皮细胞系19(arpe-19)(参见图4b)。此外,包含再工程化适体序列的所选核糖开关还响应丙舒硫胺和苯磷硫胺(在aml12细胞中)处理而增加靶基因表达(参见图4c)。[0593]此数据表明,包含再工程化适体序列的分离的核糖开关可用于响应多种合成小分子而在多种细胞类型中诱导靶基因表达。[0594]为了进一步增强基因调节活性,使用文库a4进行了第二轮诱变(参见图5)。对于此文库,3h4变体核糖开关构建体的适体序列在六个核苷酸位置,即3h4适体的预测二级结构的j3-2区域中的三个碱基和j2-4区域中的三个碱基处随机分配。挑选单个细菌菌落,并在hek293细胞中筛选含有核糖开关构建体的质粒,所述核糖开关构建体与核糖开关3h4相比,使用50μm呋喃硫胺的基因调节活性有所提高。[0595]与14g4和3h4相比,从文库a4中分离的包含不同适体变体的几个核糖开关显示出对呋喃硫胺的敏感性进一步提高,表明参与适体/配体结合的所选核苷酸的诱变可提高哺乳动物细胞中基于适体的核糖开关的基因调节活性(参见图6a)。[0596]接下来,确定了包含从适体文库a4分离的再工程化适体序列的核糖开关响应与硫胺共享化学结构特征的其它硫胺类似物的能力。如图6b中所示,包含适体15a5和15d10的3h4衍生的核糖开关响应合成分子呋喃硫胺、丙舒硫胺和苯磷硫胺而强烈地调节荧光素酶表达,但对天然存在的tpp的响应非常差。此外,与亲本核糖开关3h4相比,包含再工程化适体序列15a5和15d10的核糖开关响应呋喃硫胺、丙舒硫胺和苯磷硫胺而表现出显著改善的动态范围。[0597]此实施例说明,通过多轮诱变,可产生包含再工程化适体序列的改进的核糖开关,其响应用几种合成硫胺类似物的处理而增强靶基因表达。[0598]实施例4.合成硫胺类似物核糖开关可响应呋喃硫胺而调节各种靶基因的表达[0599]如实施例3中所讨论的,包含再工程化适体序列的分离的核糖开关响应各种硫胺类似物而有效地诱导报告蛋白荧光素酶的表达。为了测试分离的适体调节其它靶基因表达的能力,将几个包含再工程化适体序列的核糖开关插入至鼠红细胞生成素(mepo)的cdna序列和增强型绿荧光蛋白(egfp)的cdna序列中。[0600]实验程序:[0601]核糖开关构建体:将分别含有适体3h4或15d10的选择性剪接核糖开关在位置308插入构建体con8-epo(seqidno:85)中的小鼠红细胞生成素cdna序列中,产生构建体epo-3h4(seqidno:86)和epo-15d10(seqidno:87)。红细胞生成素基因的表达由巨细胞病毒(cmv)启动子驱动。将含有适体6b4的核糖开关盒在位置276插入载体pegfp-c1中编码增强型绿荧光蛋白(egfp)的cdna序列中,以产生egfp-6b4构建体(seqidno:88)。将没有适体序列的内含子-外显子-内含子盒插入con8-epo以产生构建体epo-con1(seqidno:89),作为组成型靶基因表达的对照。[0602]seqidno:86是通过将3h4核糖开关插入红细胞生成素基因而获得的。大写字母表示红细胞生成素编码序列(参见seqidno:85)。小写字母表示内含子/选择性外显子/内含子和核糖开关序列。3h4适体编码序列(seqidno:9)加下划线。[0603]seqidno:86[0604]atgggggtgcccgaacgtcccaccctgctgcttttactctccttgctactgattcctctgggcctcccagtcctctgtgctcccccacgcctcatctgcgacagtcgagttctggagaggtacatcttagaggccaaggaggcagaaaatgtcacgatgggttgtgcagaaggtcccagactgagtgaaaatattacagtcccagataccaaagtcaacttctatgcttggaaaagaatggaggtggaagaacaggccatagaagtttggcaaggcctgtccctgctctcagaagccatcctgcagggtgagtctatgggacccttgatgttttctttccccttcttttctatggttaagttcatgtcataggaaggggagaagtaacagggtacacatattgaccaaatcagggtaattttgcatttgtaattttaaaaaatgctttcttcttttaatatacttttttgtttatcttatttctaatactttccctaatctctttctttcagggcaataatgatacaatgtatcatgccgagtaacgctgtttctctaacttgtaggaatgaattcagatatttccagagaatgaaaaaaaatcttcagtagaaggtaatgtacaggggtccggccttttcatttggcgccggtgagagcacaccctttgaacctgttcacggataatgccgctgcagggagtacattacgcaccattctaaagaataacagtgataatttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgtaagaggtttcatattgctaatagcagctacaatccagctaccattctgcttttattttatggttgggataaggctggattattctgagtccaagctaggcccttttgctaatcatgttcatacctcttatcttcctcccacagcccaggccctgctagccaattcctcccagccaccagagacccttcagcttcatatagacaaagccatcagtggtctacgtagcctcacttcactgcttcgggtactgggagctcagaaggaattgatgtcgcctccagataccaccccacctgctccactccgaacactcacagtggatactttctgcaagctcttccgggtctacgccaacttcctccgggggaaactgaagctgtacacgggagaggtctgcaggagaggggacaggtga[0605]seqidno:87是通过将15d10核糖开关插入红细胞生成素基因而获得的。大写字母表示红细胞生成素编码序列(参见seqidno:85)。小写字母表示内含子/选择性外显子/内含子和核糖开关序列。15d10适体编码序列(seqidno:26)加下划线。[0606]seqidno:87[0607]atgggggtgcccgaacgtcccaccctgctgcttttactctccttgctactgattcctctgggcctcccagtcctctgtgctcccccacgcctcatctgcgacagtcgagttctggagaggtacatcttagaggccaaggaggcagaaaatgtcacgatgggttgtgcagaaggtcccagactgagtgaaaatattacagtcccagataccaaagtcaacttctatgcttggaaaagaatggaggtggaagaacaggccatagaagtttggcaaggcctgtccctgctctcagaagccatcctgcagggtgagtctatgggacccttgatgttttctttccccttcttttctatggttaagttcatgtcataggaaggggagaagtaacagggtacacatattgaccaaatcagggtaattttgcatttgtaattttaaaaaatgctttcttcttttaatatacttttttgtttatcttatttctaatactttccctaatctctttctttcagggcaataatgatacaatgtatcatgccgagtaacgctgtttctctaacttgtaggaatgaattcagatatttccagagaatgaaaaaaaatcttcagtagaaggtaatgtacaggggtccggccttttcatttggcaccggtgagaacatacccttcggacctgttcacggataatgccgctgcagggagtacattacgcaccattctaaagaataacagtgataatttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgtaagaggtttcatattgctaatagcagctacaatccagctaccattctgcttttattttatggttgggataaggctggattattctgagtccaagctaggcccttttgctaatcatgttcatacctcttatcttcctcccacagcccaggccctgctagccaattcctcccagccaccagagacccttcagcttcatatagacaaagccatcagtggtctacgtagcctcacttcactgcttcgggtactgggagctcagaaggaattgatgtcgcctccagataccaccccacctgctccactccgaacactcacagtggatactttctgcaagctcttccgggtctacgccaacttcctccgggggaaactgaagctgtacacgggagaggtctgcaggagaggggacaggtga[0608]seqidno:88是通过将6b4核糖开关插入egfp基因而获得的。大写字母表示egfp编码序列。小写字母表示内含子/选择性外显子/内含子和核糖开关序列。6b4适体编码序列(seqidno:14)加下划线。[0609]seqidno:88[0610]atggtgagcaagggcgaggagctgttcaccggggtggtgcccatcctggtcgagctggacggcgacgtaaacggccacaagttcagcgtgtccggcgagggcgagggcgatgccacctacggcaagctgaccctgaagttcatctgcaccaccggcaagctgcccgtgccctggcccaccctcgtgaccaccctgacctacggcgtgcagtgcttcagccgctaccccgaccacatgaagcagcacgacttcttcaagtccgccatgcccgaagggtgagtctatgggacccttgatgttttctttccccttcttttctatggttaagttcatgtcataggaaggggagaagtaacagggtacacatattgaccaaatcagggtaattttgcatttgtaattttaaaaaatgctttcttcttttaatatacttttttgtttatcttatttctaatactttccctaatctctttctttcagggcaataatgatacaatgtatcatgccgagtaacgctgtttctctaacttgtaggaatgaattcagatatttccagagaatgaaaaaaaatcttcagtagaaggtaatgtacaggggtccggccttttcatttggcgccggtgagagcacacccttgtgacctgtttacggataatgccgccgcagggagtacattacgcaccattctaaagaataacagtgataatttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgtaagaggtttcatattgctaatagcagctacaatccagctaccattctgcttttattttatggttgggataaggctggattattctgagtccaagctaggcccttttgctaatcatgttcatacctcttatcttcctcccacagctacgtccaggagcgcaccatcttcttcaaggacgacggcaactacaagacccgcgccgaggtgaagttcgagggcgacaccctggtgaaccgcatcgagctgaagggcatcgacttcaaggaggacggcaacatcctggggcacaagctggagtacaactacaacagccacaacgtctatatcatggccgacaagcagaagaacggcatcaaggtgaacttcaagatccgccacaacatcgaggacggcagcgtgcagctcgccgaccactaccagcagaacacccccatcggcgacggccccgtgctgctgcccgacaaccactacctgagcacccagtccgccctgagcaaagaccccaacgagaagcgcgatcacatggtcctgctggagttcgtgaccgccgccgggatcactctcggcatggacgagctgtacaagtaa[0611]seqidno:89是通过将不含适体序列的内含子-外显子-内含子盒插入红细胞生成素基因而获得的。大写字母表示红细胞生成素编码序列(参见seqidno:85)。小写字母表示内含子/选择性外显子/内含子序列。[0612]seqidno:89[0613]atgggggtgcccgaacgtcccaccctgctgcttttactctccttgctactgattcctctgggcctcccagtcctctgtgctcccccacgcctcatctgcgacagtcgagttctggagaggtacatcttagaggccaaggaggcagaaaatgtcacgatgggttgtgcagaaggtcccagactgagtgaaaatattacagtcccagataccaaagtcaacttctatgcttggaaaagaatggaggtggaagaacaggccatagaagtttggcaaggcctgtccctgctctcagaagccatcctgcagggtgagtctatgggacccttgatgttttctttccccttcttttctatggttaagttcatgtcataggaaggggagaagtaacagggtacacatattgaccaaatcagggtaattttgcatttgtaattttaaaaaatgctttcttcttttaatatacttttttgtttatcttatttctaatactttccctaatctctttctttcagggcaataatgatacaatgtatcatgcctctttgcaccattctaaagaataacagtgataatttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgtaagaggtttcatattgctaatagcagctacaatccagctaccattctgcttttattttatggttgggataaggctggattattctgagtccaagctaggcccttttgctaatcatgttcatacctcttatcttcctcccacagcccaggccctgctagccaattcctcccagccaccagagacccttcagcttcatatagacaaagccatcagtggtctacgtagcctcacttcactgcttcgggtactgggagctcagaaggaattgatgtcgcctccagataccaccccacctgctccactccgaacactcacagtggatactttctgcaagctcttccgggtctacgccaacttcctccgggggaaactgaagctgtacacgggagaggtctgcaggagaggggacaggtga.[0614]小鼠红细胞生成素的酶联免疫吸附分析(elisa):如实施例1中所述地用transit-x2转染试剂(mirusbio)转染aml12细胞。转染后四小时,aml12细胞用或不用指定剂量的呋喃硫胺处理。在呋喃硫胺处理后24小时收集转染细胞的上清液,并按照制造商的说明(r&d)进行elisa以检测上清液中的mepo。[0615]产生表达egfp-6b4的细胞系:通过使用genepulserxcell(bio-rad)用100ng质粒dna电穿孔hek293细胞并应用hek293细胞的默认参数来产生含有egfp-6b4构建体的稳定细胞系。电穿孔后48小时,细胞培养物用800μg/ml抗生素g418处理两周以选择稳定表达egfp-6b4盒的细胞,所述盒带有g418抗性基因。细胞被胰蛋白酶消化。使用guavaeasycyte8ht机器通过流式细胞术测定细胞悬浮液中egfp荧光的强度。使用guavasoft3.3分析所得数据。诱导的倍数增加计算为从用呋喃硫胺处理后的细胞获得的平均荧光强度(mfi)除以从未用呋喃硫胺处理的细胞获得的mfi的商。[0616]流式细胞术分析:在呋喃硫胺处理前一天,将用egfp-6b4构建体稳定转导的1.5×105个hek293细胞接种在24孔板中。用呋喃硫胺处理细胞24小时。如上所述地通过流式细胞术测定egfp荧光的强度。[0617]结果:[0618]细胞表达构建体egfp-6b4在不存在呋喃硫胺处理的情况下表现出报告蛋白egfp的低表达,但在存在呋喃硫胺的情况下egfp表达增加了14倍(参见图7a),说明了包含再工程化适体6b4的核糖开关响应合成配体呋喃硫胺诱导除荧光素酶以外的报告蛋白的表达的能力。此外,响应呋喃硫胺处理的egfp表达的诱导是剂量依赖性的(参见图7b)。[0619]接下来,检查了包含适体3h4和15d10的核糖开关调节mepo基因表达的能力。在不存在呋喃硫胺的情况下,含有mepo-3h4或mepo-15d10的细胞表达非常低水平的mepo。然而,在用呋喃硫胺处理后,mepo的表达在含有mepo-3h4或mepo-15d10构建体的细胞中以剂量依赖性方式增强。如所预期,对照构建体mepo-con1组成型表达mepo,无论是否存在呋喃硫胺(参见图7c)。响应用12.5μm呋喃硫胺处理,与不存在呋喃硫胺时的表达相比,mepo的表达被诱导约40倍(epo-15d10)或9倍(epo-3h4)(参见图7d),在12.5μm诱导剂下,mepo-15d10的mepo大约是组成型和不可调节mepo-con1构建体的61.3%。[0620]这些结果表明,包含再工程化适体序列的核糖开关响应小分子诱导基因表达的能力不限于特定靶基因序列,表明这些适体核糖开关在调节靶基因表达中的普遍适用性。[0621]实施例5:合成核糖开关在小鼠体内调节基因表达[0622]为了评估再工程化适体在体内诱导基因表达的能力,用携带再工程化核糖开关的腺相关病毒载体(aav)转染小鼠,所述核糖开关被插入报告蛋白荧光素酶的基因中。丙舒硫胺用作适体配体以诱导荧光素酶表达。[0623]实验程序:[0624]aav2.8病毒颗粒生产:用于转染小鼠的aav2.8颗粒包含衍生自aav2的病毒基因组和衍生自aav8的衣壳。将含有内含子-外显子-内含子盒的荧光素酶基因克隆至aav2质粒载体中,所述内含子-外显子-内含子盒分别具有(1)不含适体的不可调节核糖开关(“luci-con1”,seqidno:90),(2)包含适体3h4的核糖开关盒(“luci-3h4”,seqidno:91),或(3)包含适体6b4的核糖开关盒(“luci-6b4”,seqidno:92)。荧光素酶基因的表达由casi启动子控制,所述启动子包括cmv和泛素c增强子元件以及鸡β-肌动蛋白启动子。将病毒载体包装至aav8衣壳中,并按照制造商的方案(vigenebiosciences)生产。[0625]seqidno:90是通过将不含适体序列的内含子-外显子-内含子盒插入荧光素酶报告基因而获得的。大写字母表示荧光素酶编码序列。小写字母表示内含子/选择性外显子/内含子序列。[0626]seqidno:90[0627]atggaagacgccaaaaacataaagaaaggcccggcgccattctatccgctggaagatggaaccgctggagagcaactgcataaggctatgaagagatacgccctggttcctggaacaattgcttttacagatgcacatatcgaggtggacatcacttacgctgagtacttcgaaatgtccgttcggttggcagaagctatgaaacgatatgggctgaatacaaatcacagaatcgtcgtatgcagtgaaaactctcttcaattctttatgccggtgttgggcgcgttatttatcggagttgcagttgcgcccgcgaacgacatttataatgaacgtgaattgctcaacagtatgggcatttcgcagcctaccgtggtgttcgtttccaaaaaggggttgcaaaaaattttgaacgtgcaaaaaaagctcccaatcatccaaaaaattattatcatggattctaaaacggattaccagggatttcagtcgatgtacacgttcgtcacatctcatctacctcccggttttaatgaatacgattttgtgccagagtccttcgatagggacaagacaattgcactgatcatgaactcctctggatctactggtctgcctaaaggtgtcgctctgcctcatagaactgcctgcgtgagattctcgcatgccagagatcctatttttggcaatcaaatcattccggatactgcgattttaagtgttgttccattccatcacggttttggaatgtttactacactcggatatttgatatgtggatttcgagtcgtcttaatgtatagatttgaagaagagctgtttctgaggagccttcaggattacaagattcaaagtgcgctgctggtgccaaccctattctccttcttcgccaaaagcactctgattgacaaatacgatttatctaatttacacgaaattgcttctggtggcgctcccctctctaaggaagtcggggaagcggttgccaagaggttccatctgccaggtatcagggtgagtctatgggacccttgatgttttctttccccttcttttctatggttaagttcatgtcataggaaggggagaagtaacagggtacacatattgaccaaatcagggtaattttgcatttgtaattttaaaaaatgctttcttcttttaatatacttttttgtttatcttatttctaatactttccctaatctctttctttcagggcaataatgatacaatgtatcatgcctctttgcaccattctaaagaataacagtgataatttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgtaagaggtttcatattgctaatagcagctacaatccagctaccattctgcttttattttatggttgggataaggctggattattctgagtccaagctaggcccttttgctaatcatgttcatacctcttatcttcctcccacagcaaggatatgggctcactgagactacatcagctattctgattacacccgagggggatgataaaccgggcgcggtcggtaaagttgttccattttttgaagcgaaggttgtggatctggataccgggaaaacgctgggcgttaatcaaagaggcgaactgtgtgtgagaggtcctatgattatgtccggttatgtaaacaatccggaagcgaccaacgccttgattgacaaggatggatggctacattctggagacatagcttactgggacgaagacgaacacttcttcatcgttgaccgcctgaagtctctgattaagtacaaaggctatcaggtggctcccgctgaattggaatccatcttgctccaacaccccaacatcttcgacgcaggtgtcgcaggtcttcccgacgatgacgccggtgaacttcccgccgccgttgttgttttggagcacggaaagacgatgacggaaaaagagatcgtggattacgtcgccagtcaagtaacaaccgcgaaaaagttgcgcggaggagttgtgtttgtggacgaagtaccgaaaggtcttaccggaaaactcgacgcaagaaaaatcagagagatcctcataaaggccaagaagggcggaaagatcgccgtgtaa[0628]seqidno:91是通过将3h4核糖开关插入荧光素酶报告基因而获得的。大写字母表示荧光素酶编码序列。小写字母表示内含子/选择性外显子/内含子和核糖开关序列。3h4适体编码序列(seqidno:9)加下划线。[0629]seqidno:91[0630]atggaagacgccaaaaacataaagaaaggcccggcgccattctatccgctggaagatggaaccgctggagagcaactgcataaggctatgaagagatacgccctggttcctggaacaattgcttttacagatgcacatatcgaggtggacatcacttacgctgagtacttcgaaatgtccgttcggttggcagaagctatgaaacgatatgggctgaatacaaatcacagaatcgtcgtatgcagtgaaaactctcttcaattctttatgccggtgttgggcgcgttatttatcggagttgcagttgcgcccgcgaacgacatttataatgaacgtgaattgctcaacagtatgggcatttcgcagcctaccgtggtgttcgtttccaaaaaggggttgcaaaaaattttgaacgtgcaaaaaaagctcccaatcatccaaaaaattattatcatggattctaaaacggattaccagggatttcagtcgatgtacacgttcgtcacatctcatctacctcccggttttaatgaatacgattttgtgccagagtccttcgatagggacaagacaattgcactgatcatgaactcctctggatctactggtctgcctaaaggtgtcgctctgcctcatagaactgcctgcgtgagattctcgcatgccagagatcctatttttggcaatcaaatcattccggatactgcgattttaagtgttgttccattccatcacggttttggaatgtttactacactcggatatttgatatgtggatttcgagtcgtcttaatgtatagatttgaagaagagctgtttctgaggagccttcaggattacaagattcaaagtgcgctgctggtgccaaccctattctccttcttcgccaaaagcactctgattgacaaatacgatttatctaatttacacgaaattgcttctggtggcgctcccctctctaaggaagtcggggaagcggttgccaagaggttccatctgccaggtatcagggtgagtctatgggacccttgatgttttctttccccttcttttctatggttaagttcatgtcataggaaggggagaagtaacagggtacacatattgaccaaatcagggtaattttgcatttgtaattttaaaaaatgctttcttcttttaatatacttttttgtttatcttatttctaatactttccctaatctctttctttcagggcaataatgatacaatgtatcatgccgagtaacgctgtttctctaacttgtaggaatgaattcagatatttccagagaatgaaaaaaaatcttcagtagaaggtaatgtacaggggtccggccttttcatttggcgccggtgagagcacaccctttgaacctgttcacggataatgccgctgcagggagtacattacgcaccattctaaagaataacagtgataatttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgtaagaggtttcatattgctaatagcagctacaatccagctaccattctgcttttattttatggttgggataaggctggattattctgagtccaagctaggcccttttgctaatcatgttcatacctcttatcttcctcccacagcaaggatatgggctcactgagactacatcagctattctgattacacccgagggggatgataaaccgggcgcggtcggtaaagttgttccattttttgaagcgaaggttgtggatctggataccgggaaaacgctgggcgttaatcaaagaggcgaactgtgtgtgagaggtcctatgattatgtccggttatgtaaacaatccggaagcgaccaacgccttgattgacaaggatggatggctacattctggagacatagcttactgggacgaagacgaacacttcttcatcgttgaccgcctgaagtctctgattaagtacaaaggctatcaggtggctcccgctgaattggaatccatcttgctccaacaccccaacatcttcgacgcaggtgtcgcaggtcttcccgacgatgacgccggtgaacttcccgccgccgttgttgttttggagcacggaaagacgatgacggaaaaagagatcgtggattacgtcgccagtcaagtaacaaccgcgaaaaagttgcgcggaggagttgtgtttgtggacgaagtaccgaaaggtcttaccggaaaactcgacgcaagaaaaatcagagagatcctcataaaggccaagaagggcggaaagatcgccgtgtaa[0631]seqidno:92是通过将6b4核糖开关插入荧光素酶报告基因而获得的。大写字母表示荧光素酶编码序列。小写字母表示内含子/选择性外显子/内含子和核糖开关序列。6b4适体编码序列(seqidno:14)加下划线。[0632]seqidno:92[0633]atggaagacgccaaaaacataaagaaaggcccggcgccattctatccgctggaagatggaaccgctggagagcaactgcataaggctatgaagagatacgccctggttcctggaacaattgcttttacagatgcacatatcgaggtggacatcacttacgctgagtacttcgaaatgtccgttcggttggcagaagctatgaaacgatatgggctgaatacaaatcacagaatcgtcgtatgcagtgaaaactctcttcaattctttatgccggtgttgggcgcgttatttatcggagttgcagttgcgcccgcgaacgacatttataatgaacgtgaattgctcaacagtatgggcatttcgcagcctaccgtggtgttcgtttccaaaaaggggttgcaaaaaattttgaacgtgcaaaaaaagctcccaatcatccaaaaaattattatcatggattctaaaacggattaccagggatttcagtcgatgtacacgttcgtcacatctcatctacctcccggttttaatgaatacgattttgtgccagagtccttcgatagggacaagacaattgcactgatcatgaactcctctggatctactggtctgcctaaaggtgtcgctctgcctcatagaactgcctgcgtgagattctcgcatgccagagatcctatttttggcaatcaaatcattccggatactgcgattttaagtgttgttccattccatcacggttttggaatgtttactacactcggatatttgatatgtggatttcgagtcgtcttaatgtatagatttgaagaagagctgtttctgaggagccttcaggattacaagattcaaagtgcgctgctggtgccaaccctattctccttcttcgccaaaagcactctgattgacaaatacgatttatctaatttacacgaaattgcttctggtggcgctcccctctctaaggaagtcggggaagcggttgccaagaggttccatctgccaggtatcagggtgagtctatgggacccttgatgttttctttccccttcttttctatggttaagttcatgtcataggaaggggagaagtaacagggtacacatattgaccaaatcagggtaattttgcatttgtaattttaaaaaatgctttcttcttttaatatacttttttgtttatcttatttctaatactttccctaatctctttctttcagggcaataatgatacaatgtatcatgccgagtaacgctgtttctctaacttgtaggaatgaattcagatatttccagagaatgaaaaaaaatcttcagtagaaggtaatgtacaggggtccggccttttcatttggcgccggtgagagcacacccttgtgacctgtttacggataatgccgccgcagggagtacattacgcaccattctaaagaataacagtgataatttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgtaagaggtttcatattgctaatagcagctacaatccagctaccattctgcttttattttatggttgggataaggctggattattctgagtccaagctaggcccttttgctaatcatgttcatacctcttatcttcctcccacagcaaggatatgggctcactgagactacatcagctattctgattacacccgagggggatgataaaccgggcgcggtcggtaaagttgttccattttttgaagcgaaggttgtggatctggataccgggaaaacgctgggcgttaatcaaagaggcgaactgtgtgtgagaggtcctatgattatgtccggttatgtaaacaatccggaagcgaccaacgccttgattgacaaggatggatggctacattctggagacatagcttactgggacgaagacgaacacttcttcatcgttgaccgcctgaagtctctgattaagtacaaaggctatcaggtggctcccgctgaattggaatccatcttgctccaacaccccaacatcttcgacgcaggtgtcgcaggtcttcccgacgatgacgccggtgaacttcccgccgccgttgttgttttggagcacggaaagacgatgacggaaaaagagatcgtggattacgtcgccagtcaagtaacaaccgcgaaaaagttgcgcggaggagttgtgtttgtggacgaagtaccgaaaggtcttaccggaaaactcgacgcaagaaaaatcagagagatcctcataaaggccaagaagggcggaaagatcgccgtgtaa[0634]动物研究:雄性balb/c小鼠接受单次尾静脉注射的接受性aav2.8病毒颗粒的1.0×1011或2.5×1011个基因组拷贝。在aav载体递送后二十八天,小鼠用50mg/kg丙舒硫胺进行腹膜内。在给药前一天以及给药后6小时、24小时、48小时和72小时测量荧光素酶活性。在第一次施用丙舒硫胺后,对小鼠进行如下三轮额外的给药和成像周期:第36天(aav施用后):100mg/kg;第43天:200mg/kg;以及第51天:400mg/kg。[0635]无创活体动物生物发光成像:在成像之前,小鼠用2%异氟醚麻醉,且注射150mg/kg体重的荧光素。在给药后的指定时间点,使用brukerxtreme系统在荧光素注射后2至5分钟内拍摄图像。荧光素酶活性表示为平均光子/秒±s.d.(n=5)。荧光素酶基因表达的诱导倍数计算为从用丙舒硫胺的小鼠获得的光子/秒除以在丙舒硫胺前一天从小鼠获得的值的商。[0636]结果:[0637]为了测试核糖开关在动物体内调节基因表达的作用,将带有含或不含核糖开关的荧光素酶基因的aav载体静脉内递送至小鼠体内。在aav注射后4周,小鼠用丙舒硫胺进行腹膜内(i.p.)。单剂丙舒硫胺(50mg/kg)后六小时,在注射含有包含核糖开关3h4或6b4的荧光素酶基因的aav载体的小鼠中,荧光素酶活性显著增加,但在注射相同剂量的不可调节对照载体con1的小鼠组中未显著增加(参见图8a-8e)。此外,丙舒硫胺后荧光素酶活性的增加是剂量依赖性的。在分别用单剂50mg/kg或两剂50mg/kg和100mg/kg丙舒硫胺的小鼠组中,诱导的荧光素酶活性在单剂后24小时减弱至诱导剂前的水平。然而,在另外用更高剂量的诱导剂丙舒硫胺(即200mg/kg和400mg/kg)的小鼠中,诱导的荧光素酶活性保持48小时或更长时间。[0638]这些结果表明,在用硫胺类似物后,包含再工程化适体序列的核糖开关在体内以剂量依赖性方式选择性地诱导靶基因表达。[0639]实施例6至99:硫胺类似物核糖开关响应新型硫胺类似物而调节哺乳动物细胞中的基因表达[0640]实验程序:[0641]硫胺类似物的产生[0642]所有溶剂和试剂均从商业渠道获得并按原样使用。在引用的氘化溶剂中,在bruker仪器(300mhz或400mhz)上记录1hnmr光谱。化学位移以ppm为单位,且耦合常数以赫兹为单位。所有最终化合物均通过使用220-400目硅胶的快速谱法或用ch3cn/水作为溶剂的反相hplc进行纯化。在硅胶60f-254(0.25-nm厚度)板上进行薄层谱。可视化是用uv光和/或含10%磷钼酸的乙醇完成的。在waterslct或appliedbiosystemsapi3000质谱仪上获得标称(低分辨率)质谱。在waterslct或agilenttof质谱仪上获得高分辨率质谱(hrms)。所有其它lc-ms实验均在与agilent单四极杆质谱仪联用的agilent1100hplc上完成。化合物纯度通过具有230nm和254nm波长的lc-ms测定。此处报告的所有最终化合物的纯度均≥95%。[0643]实施例6(m19)[0644](3r,5r,7r)-金刚烷-1-甲酸(((z)-2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)硫代)甲酯[0645][0646]步骤1[0647](3r,5r,7r)-金刚烷-1-碳酰氯[0648][0649]将(3r,5r,7r)-金刚烷-1-甲酸(10.0g,55.4mmol)和socl2(32.8g,275mmol,20.0ml)的混合物在25℃下搅拌1小时。tlc(二氯甲烷:甲醇=10:1,溴甲酚绿,rf=0.62)表明起始材料已完全消耗。浓缩混合物得到呈无结晶状的标题化合物(11.0g,99.7%),其不经进一步纯化即直接用于下一步反应。[0650]步骤2[0651](3r,5r,7r)-金刚烷-1-甲酸氯甲酯[0652][0653]在20℃下向(3r,5r,7r)-金刚烷-1-甲酸(15g,83.2mmol,1当量)、四丁基溴化铵(tbab)(2.68g,8.32mmol,0.1当量)和nahco3(21.0g,250.0mmol,3当量)于dcm(150ml)和h2o(150ml)中的混合物中逐滴添加氯(氯磺酰氧基)甲烷(16.5g,99.9mmol,1.2当量)。将混合物在20℃下搅拌15小时(气体逸出)。静置后,混合物分成两层,且水层用二氯甲烷(100ml×2)萃取。合并的有机相用无水na2so4干燥,过滤,浓缩,得到粗制无油状物。粗产物用石油醚(500ml)稀释并通过硅胶垫过滤。将滤液浓缩,得到呈无油状的标题化合物(15.5g,81.4%)。1hnmr(400mhz,dmso-d6)δ5.72(s,2h),2.05-1.92(m,6h),1.74-1.70(m,2h)。[0654]步骤3[0655](3r,5r,7r)-金刚烷-1-甲酸(((z)-2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)硫代)甲酯[0656][0657]向维生素b1(10g,33.2mmol,1当量)和ki(551.0mg,3.32mmol,0.1当量)于h2o(150ml)和thf(150ml)中的混合物中逐份添加naoh(2.66g,66.5mmol,2当量)并将混合物在20℃下搅拌0.5小时。将(3r,5r,7r)-金刚烷-1-甲酸氯甲酯(15.2g,66.5mmol,2当量)逐滴添加至混合物中,并将所得混合物在20℃下再搅拌12小时。lcms显示反应完成。反应混合物分成两层。用乙酸乙酯(200ml×3)萃取水层。合并的有机相用无水na2so4干燥,过滤并浓缩,得到粗产物(tlc:乙酸乙酯/乙醇=10/1,产物rf=0.2)。粗产物经硅胶谱(二氯甲烷/甲醇=10/1)纯化,得到呈黄固体状的产物,其通过制备型hplc(谱柱:watersxbridgebehc18250×50mm,10μm;流动相:水-乙腈,含0.05%氢氧化氨v/v,20min)进一步纯化,得到呈白固体状的标题化合物(580.24mg,4%)。1hnmr(400mhz,dmso-d6)δ7.93(s,1h),7.82(s,1h),6.96(br,2h),4.95(s,2h),4.68(t,j=5.2hz,1h),4.32(s,2h),3.52-3.48(m,2h),2.58(m,2h),2.28(s,3h),1.94(s,6h),1.80-1.78(m,6h),1.68-1.62(m,6h)。ms(es+)m/e475.2(m+h)+。[0658]实施例7(m10)[0659]特戊酸(z)-((2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)硫代)甲酯[0660][0661]向维生素b1(1.00g,3.78mmol,1.00当量)于etoh(10.0ml)中的溶液中添加naoet(257mg,3.78mmol,1.00当量)、特戊酸氯甲酯(569mg,3.78mmol,547μl,1.00当量)和naoh(45.4mg,1.13mmol,0.30当量)。在20℃下搅拌混合物2小时。在减压下浓缩反应混合物,得到残余物。残余物通过制备型hplc纯化,得到呈淡黄固体状的标题化合物(61.0mg,3.4%)。1hnmr(400mhz,dmso-d6)δ7.93(s,1h),7.83(s,1h),6.71(brd,j=0.9hz,2h),4.96(s,2h),4.69(t,j=5.5hz,1h),4.34(brs,2h),3.60-3.42(m,2h),2.59(t,j=6.9hz,2h),2.28(s,3h),1.96(s,3h),1.12(s,9h)。ms(es+)m/e397.3(m+h)+。[0662]实施例8(m16)[0663]异丁酸(z)-((2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)硫代)甲酯[0664][0665]步骤1[0666](z)-2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺)-5-羟基戊-2-烯-3-硫醇钠[0667][0668]在-10℃下向维生素b1(40.0g,132mmol)于etoh(80.0ml)中的溶液中添加naoet(40.0g,123mmol)于etoh中的溶液。将混合物在10℃下搅拌30分钟。通过过滤收集形成的固体并干燥,得到呈黄固体状的标题化合物(36.0g,88.9%)。1hnmr(400mhz,dmso-d6)δ9.51(s,1h),8.05(s,1h),7.18(s,2h),5.41(s,3h),3.65-3.62(m,2h),3.01-2.95(m,2h),2.48(s,3h),2.34(s,3h)。[0669]步骤2[0670]异丁酸(z)-((2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)硫代)甲酯[0671][0672]在25℃下向(z)-2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺)-5-羟基戊-2-烯-3-硫醇钠(3.00g,9.86mmol)于etoh(30.0ml)中的混合物中添加naoh(120mg,3.00mmol),接着添加异丁酸氯甲酯(1.35g,9.88mmol)。将混合物在25℃下搅拌1小时并浓缩,得到残余物。将残余物通过制备型hplc(碱性条件)纯化并冻干,得到150mg粗制棕固体,将其进一步通过制备型hplc纯化(用nh4hco3缓冲),接着冻干,得到呈黄固体状的标题化合物(50.1mg,29%)。1hnmr(400mhz,dmso-d6)δ7.92(s,1h),7.83(s,1h),6.70(br,2h),4.96(s,2h),4.69(t,j=5.2hz,1h),4.34(s,2h),3.41-3.52(m,2h),2.58(t,j=6.8hz,2h),2.50-2.40(m,1h),2.28(s,3h),1.95(s,3h),1.08(d,j=7.2hz,6h)。ms(es+)m/e383.3(m+h)+。[0673]实施例9(m18)[0674]特戊酸(z)-1-((2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)硫代)乙酯[0675][0676]步骤1[0677]特戊酸1-氯乙酯[0678][0679]向特戊酰氯(9.80g,81.2mmol,10.0ml)和2,4,6-三甲基-1,3,5-三噁烷(4.95g,37.4mmol,5.00ml)的混合物中添加zncl2(1m,2.50ml)并将混合物在90℃下搅拌1小时。将反应混合物冷却至室温并用etoac(100ml)稀释。所得有机溶液用冰冷的nahco3(20.0ml×3)溶液和盐水洗涤,经na2so4干燥,过滤并浓缩,得到残余物。将残余物在90℃下蒸馏(表压:-0.09mpa),得到呈无油状的标题化合物(1.60g)。1hnmr(400mhz,cdcl3)δ6.52-6.56(m,1h),1.80(d,j=5.6hz,3h),1.22(s,9h)。[0680]步骤2[0681]特戊酸(z)-1-((2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)硫代)乙酯[0682][0683]在25℃下向(z)-2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺)-5-羟基戊-2-烯-3-硫醇钠(3.00g,9.86mmol)于etoh(30.0ml)中的混合物中添加含naoet(3.20g,9.88mmol)的etoh,接着添加特戊酸1-氯乙酯(1.60g,9.72mmol)和naoh(120mg,3.00mmol)。将混合物在25℃下搅拌12小时并浓缩,得到残余物。残余物通过制备型hplc纯化,接着冻干,得到呈黄固体状的标题化合物(60.0mg,2%产率)。1hnmr(400mhz,dmso-d6)δ7.92(s,1h),7.85(s,1h),6.48(br,2h),5.74-5.79(m,1h),4.46(d,j=15.2hz,1h),4.37(s,1h),4.28(d,j=15.2hz,1h),3.53-3.55(m,2h),2.52-2.57(m,2h),2.30(s,3h),1.95(s,3h),1.29(d,j=6.4hz,3h),1.33(s,9h)。ms(es+)m/e411.3(m+h)+。[0684]实施例10(m21)[0685]苯甲酸(z)-((2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)硫代)甲酯[0686][0687]向维生素b1(5g,16.6mmol,1当量)和ki(138.0mg,831.0μmol,0.05当量)于h2o(25ml)中的混合物中逐份添加naoh(1.33g,33.2mmol,2当量)。将混合物在20℃下搅拌0.5小时,且接着逐滴添加苯甲酸氯甲酯(2.84g,16.6mmol,1当量)于thf(25ml)中的溶液。接着将反应混合物在20℃下再搅拌10小时。lcms显示形成新产物。通过添加5ml甲醇淬灭混合物,且用饱和碳酸氢钠水溶液将ph调节至~7。接着用乙酸乙酯(200ml×2)萃取水相。合并的有机相用无水na2so4干燥,过滤并浓缩,得到粗产物,将其用乙酸乙酯(50ml)湿磨,得到呈白固体状的标题化合物(700mg,10%)。1hnmr(400mhz,dmso-d6)δ7.96-7.92(m,3h),7.81(s,1h),7.73-7.67(m,1h),7.57-7.53(m,2h),6.76(brs,2h),5.28(s,2h),4.74-4.70(m,1h),4.32(s,2h),3.54-3.48(m,2h),2.69-2.66(m,2h),2.26(s,3h),1.96(s,3h)。ms(es+)m/e417.2(m+h)+。[0688]实施例11(m34)[0689]萘-1-硫代碳酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0690][0691]向维生素b1(9g,29.9mmol,1当量)和ki(497.0mg,2.99mmol,0.1当量)于h2o(150ml)和thf(150ml)中的混合物中添加naoh(2.39g,59.8mmol,2当量)。将混合物在20℃下搅拌0.5小时。逐滴添加1-萘甲酰氯(11.1g,58.0mmol,8.71ml,1.94当量)。将反应混合物在20℃下再搅拌12小时。lcms显示反应完成。用乙酸乙酯(100ml×3)萃取反应混合物。将水相用饱和碳酸氢钠溶液调节至ph7~8,且用乙酸乙酯(100ml×3)萃取。合并的有机相用无水na2so4干燥,过滤并浓缩,得到粗产物,将其用乙酸乙酯(10ml)湿磨,得到呈灰白固体状的标题化合物(420mg,962μmol,3%产率)。1hnmr(400mhz,dmso-d6)δ8.21-8.20(m,2h),8.05-8.02(m,1h),7.99(s,1h),7.92-7.91(m,1h),7.88(s,1h),7.68-7.59(m,3h),6.74(brs,2h),4.70-4.68(m,1h),4.44(s,2h),3.53(m,2h),2.70-2.68(m,2h),2.19(s,3h),2.13(s,3h)。ms(es+)m/e437.1(m+h)+。[0692]实施例12(m26)[0693]硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0694][0695]在0℃下向维生素b1(1.00g,3.32mmol,1.00当量)和naoh(133.0mg,3.32mmol,1.00当量)于h2o(50.0ml)和thf(5.00ml)中的溶液中添加苯甲酰氯(935.0mg,6.65mmol,772.0μl,2.00当量)。将反应混合物在0℃下搅拌0.5小时。lcms显示起始材料被消耗并且检测到具有所需质量的产物。将反应混合物用meoh(5.00ml)淬灭并调节至ph=7,并用10:1dcm:meoh(25.0ml×2)萃取。合并的有机层用na2so4干燥,过滤并减压浓缩,得到粗产物,其在用etoac/etoh/dcm(2:2:1)湿磨后得到呈白固体状的标题化合物(251mg,18.6%)。1hnmr(400mhz,dmso-d6)δ7.89(s,1h),7.82(s,1h),7.73(d,j=7.2hz,2h),7.68(t,j=7.6hz,1h),7.53(t,j=7.6hz,2h),6.65(brs,2h),4.64(t,j=4.2hz,1h),4.39(s,2h),3.46(m,2h),2.57(m,2h),2.16(s,3h),2.14(s,3h)。ms(es+)m/e387.0(m+h)+。[0696]实施例13(m27)[0697]2-甲基硫代丙酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0698][0699]在0℃下向维生素b1(1.00g,3.32mmol,1.00当量)和naoh(266mg,6.65mmol,2.00当量)于h2o(50.0ml)和thf(5.00ml)中的溶液中添加异丁酰氯(708mg,6.65mmol,695.0μl,2.00当量)。将反应混合物在0℃下搅拌0.5小时,用meoh(5.00ml)淬灭,并调节至ph=7。混合物用10:1dcm:meoh(25.0ml×2)萃取。合并的有机层经na2so4干燥、过滤并在减压下浓缩,得到粗产物。粗产物用etoac/etoh/dcm(2:2:1)湿磨,得到呈白固体状的标题化合物(224.0mg,19.0%)。1hnmr(400mhz,dmso-d6)δ7.79(s,1h),7.77(s,1h),6.68(brs,2h),4.61(t,j=4.2hz,1h),4.35(s,2h),3.40(q,j=6.8hz,2h),2.60-2.50(m,1h),2.44(t,j=7.2hz,1h),2.26(s,3h),2.07(s,3h),1.02(s,3h),1.00(s,3h)。ms(es+)m/e353.3(m+h)+。[0700]实施例14(m28)[0701]2,2-二甲基硫代丙酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0702][0703]在0℃下向(z)-2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺)-5-羟基戊-2-烯-3-硫醇钠(0.50g,1.64mmol,1.00当量)和naoh(65.7mg,1.64mmol,1.00当量)于h2o(5.00ml)中的混合物中添加特戊酰氯(198mg,1.64mmol,202μl,1当量),且将所得混合物在0℃下搅拌1小时。将混合物浓缩并通过柱谱(sio2,二氯甲烷:甲醇=100:1至10:1,tlc:二氯甲烷:甲醇=10:1,rf=0.4)纯化,得到呈白固体状的标题化合物(110mg,18.2%)。1hnmr(400mhz,dmso-d6)δ7.79(s,1h)7.75(s,1h)6.70(brs,2h)4.60(t,j=5.6hz,1h)4.35(brs,2h)3.39(q,j=6.8hz,2h)2.42(brt,j=6.8hz,2h)2.26(s,3h)2.08(s,3h)1.07(s,9h)。ms(es+)m/e367.2(m+h)+。[0704]实施例15(m29)[0705]4-甲氧基硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0706][0707]在0℃下向(z)-2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺)-5-羟基戊-2-烯-3-硫醇钠(0.50g,1.64mmol,1.00当量)和naoh(65.7mg,1.64mmol,1.00当量)于h2o(4ml)中的混合物中添加化合物4-甲氧基苯甲酰氯(280mg,1.64mmol,226μl,1.00当量),且将所得混合物在0℃下搅拌1小时。lcms显示起始材料被消耗并且检测到具有所需质量的产物。接着浓缩混合物,并通过硅胶柱谱(100:0至20:1二氯甲烷:甲醇)纯化残余物,得到呈白固体状的标题化合物(60.0mg,9%)。1hnmr(400mhz,dmso-d6)δ7.87(s,1h),7.81(s,1h),7.72(brd,j=8.8hz,2h),7.05(brd,j=8.8hz,2h),6.64(m,2h),4.64(brs,1h),4.37(brs,2h),3.84(s,3h),3.46(brd,j=4.0hz,2h),2.58(m,2h),2.19(s,3h),2.12(s,3h)。ms(es+)m/e417.1(m+h)+。[0708]实施例16(m30)[0709]2,6-二氯硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0710][0711]在0℃下向(z)-2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺)-5-羟基戊-2-烯-3-硫醇钠(0.50g,1.64mmol,1.00当量)和naoh(65.7mg,1.64mmol,1.00当量)于h2o(4.00ml)中的混合物中添加2,6-二氯苯甲酰氯(344mg,1.64mmol,235μl,1.00当量)。将所得混合物在0℃下搅拌1小时且接着浓缩,得到残余物。通过制备型hplc纯化残余物,得到呈白固体状的标题化合物(150mg,20.1%)。1hnmr(400mhz,dmso-d6)δ7.96(s,1h),7.84(s,1h),7.60-7.54(m,3h),6.68(m,2h),4.68-4.75(m,1h),4.41(brs,2h),3.46-3.52(m,2h),2.62-2.69(m,2h),2.26(s,3h),2.14(s,3h)。ms(es+)m/e455.1(m+h)+。[0712]实施例17(m31)[0713]2,2-二甲基硫代丙酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-(膦酰氧基)戊-2-烯-3-基)酯[0714][0715]步骤13-((4-氨基-2-甲基嘧啶-5-基)甲基)-4-甲基-5-(2-(膦酰氧基)乙基)噻唑-3-鎓氯化物[0716][0717]在130℃下向聚磷酸(150g,49.8mmol,1.00当量)的溶液中逐份添加维生素b1(15.0g,49.8mmol,1.00当量)。将混合物在100-130℃下搅拌2小时。添加水(250ml),且将混合物在100℃下再搅拌2小时,冷却至25℃,且用三辛胺/mtbe(1:1,250ml×2)萃取。水层经分离,用400mletoh稀释,并在25℃下搅拌2小时。通过过滤收集形成的白固体,并用etoh(200ml×2)洗涤并干燥,得到标题化合物(17.0g,98.7%)。[0718]步骤2[0719](z)-4-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-3-硫离子基戊-3-烯-1-基磷酸钠[0720][0721]在0-5℃下向3-((4-氨基-2-甲基嘧啶-5-基)甲基)-4-甲基-5-(2-(膦酰氧基)乙基)噻唑-3-鎓(2.00g,5.79mmol,1.00当量)于h2o(20ml)中的混合物中缓慢添加naoh(5.64g,42.3mmol,7.30当量)。将混合物在5-10℃下搅拌0.5小时并浓缩,得到呈黄固体状的标题化合物(2.40g,97%),其不经进一步纯化即直接用于下一步反应。[0722]步骤32,2-二甲基硫代丙酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-(膦酰氧基)戊-2-烯-3-基)酯[0723][0724]向(z)-4-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺)-3-硫代戊-3-烯-1-基磷酸钠(0.800g,1.87mmol,1.00当量)于naoh(1m,3.74ml,2.00当量)中的混合物中添加特戊酰氯(840mg,6.97mmol,857μl,3.73当量)。将所得混合物在25℃下搅拌2小时。tlc(乙酸乙酯:二氯甲烷=2:1)显示起始材料被消耗并形成新的点。将反应混合物浓缩并通过反相hplc纯化,得到呈白固体状的标题化合物(132mg,15.7%)。1hnmr(400mhz,meod)δ7.99(s,1h),7.79(s,1h),3.93(brd,j=5.6hz,2h),2.56(s,3h),2.25(s,3h),1.14(s,9h)。ms(es+)m/e447.1(m+h)+。[0725]实施例18(m32)[0726]4-甲氧基硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-(膦酰氧基)戊-2-烯-3-基)酯[0727][0728]向(z)-4-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺)-3-硫代戊-3-烯-1-基磷酸钠(0.80g,1.87mmol,1.00当量)于naoh(1m,3.74ml,2.00当量)中的混合物中添加4-甲氧基苯甲酰氯(1.19g,6.97mmol,958μl,3.73当量)。将所得混合物在25℃下搅拌2小时。tlc(乙酸乙酯:二氯甲烷=2:1)显示起始材料被消耗并形成新的点。将混合物浓缩并通过反相hplc纯化,得到呈白固体状的标题化合物(174mg,18.1%)。1hnmr(400mhz,meod)δ8.04(s,1h),7.99(s,1h),7.75(d,j=8.8hz,2h),7.00(d,j=8.8hz,2h),4.74-4.35(m,2h),4.03(q,j=5.6hz,2h),3.88(s,3h),2.81(m,2h),2.40(s,3h),2.30(s,3h)。ms(es+)m/e497.1(m+h)+。[0729]实施例19(m33)[0730]2,6-二氯硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-(膦酰氧基)戊-2-烯-3-基)酯[0731][0732]向(z)-4-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺)-3-硫代戊-3-烯-1-基磷酸钠(0.800g,1.87mmol,1.00当量)于naoh(1m,3.74ml,2.00当量)中的混合物中添加2,6-二氯苯甲酰氯(391mg,1.87mmol,268μl,1.00当量)。在25℃下搅拌混合物2小时。tlc(乙酸乙酯:二氯甲烷=2:1)显示起始材料被消耗并形成新的点。将混合物浓缩并通过反相hplc纯化,得到呈白固体状的标题化合物(72.0mg,7.20%)。1hnmr(400mhz,meod)δ8.06(s,1h),8.02(s,1h),7.44(s,3h),4.07-4.04(m,2h),2.49(s,3h),2.32(s,3h)。ms(es+)m/e535.0(m+h)+。[0733]实施例20至59:按照用于制备m34(实施例11)的程序用适当的起始材料合成以下化合物。[0734]实施例20(m37)[0735]4-甲基萘-1-硫代碳酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0736][0737]1hnmr(400mhz,dmso-d6)δ8.30-8.25(m,1h),8.13(dd,j=3.2,6.6hz,1h),7.98(s,1h),7.88-7.80(m,2h),7.69-7.64(m,2h),7.47(d,j=7.6hz,1h),6.71(brs,2h),4.69(brt,j=5.6hz,1h),4.43(brs,2h),3.55-3.47(m,2h),2.72(s,3h),2.66(brt,j=6.8hz,2h),2.18(s,3h),2.13(s,3h)。ms(es+)m/e451(m+h)+。[0738]实施例21(m38)[0739]2-乙氧基萘-1-硫代碳酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0740][0741]1hnmr(400mhz,dmso-d6)δ8.06-7.92(m,4h),7.57-7.42(m,4h),6.67(brs,2h),4.73(brt,j=4.8hz,1h),4.42(brs,2h),4.23(q,j=6.8hz,2h),3.62-3.51(m,2h),2.73(brs,2h),2.23(s,3h),2.13(s,3h),1.32(brt,j=6.8hz,3h).ms(es+)m/e481(m+h)+。[0742]实施例22(m39)[0743]4-溴萘-1-硫代碳酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0744][0745]1hnmr(400mhz,dmso-d6)δ8.27-8.23(m,2h),8.02-7.98(m,2h),7.86-7.78(m,4h),6.72(brd,j=1.2hz,2h),4.71(t,j=5.6hz,1h),4.44(brs,2h),3.53(q,j=6.4hz,2h),2.67(brt,j=6.8hz,2h),2.19(s,3h),2.08(s,3h)。ms(es+)m/e515(m+h)+。[0746]实施例23(m40)[0747]菲-9-硫代碳酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0748][0749]1hnmr(400mhz,dmso-d6)δ8.92(d,j=8.0hz,1h),8.88(d,j=8.4hz,1h),8.26-8.19(m,3h),8.03(s,1h),7.90(s,1h),7.80-7.75(m,1h),7.80-7.77(m,2h),7.74-7.72(m,1h),6.80(s,2h),4.74(t,j=4.8hz,1h),4.47(s,2h),4.11(d,j=3.6hz,2h),3.58(q,j=6.0hz,2h),3.17(d,j=2.4hz,2h),2.72(t,j=6.4hz,2h),2.21(s,3h),2.09(s,3h)。ms(es+)m/e487(m+h)+。[0750]实施例24(m43)[0751]菲-9-硫代碳酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0752][0753]1hnmr(400mhz,dmso-d6)δ7.88-7.83(m,2h),7.32-7.20(m,3h),6.73(brd,j=1.2hz,2h),4.66(t,j=5.6hz,1h),4.40(brs,2h),3.47(q,j=6.4hz,2h),2.75(brs,2h),2.67(brs,2h),2.58(brt,j=6.8hz,2h),2.21(s,3h),2.13(s,3h),1.70(m,4h)。ms(es+)m/e441(m+h)+。[0754]实施例25(m44)[0755]4-氟萘-1-硫代碳酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0756][0757]1hnmr(400mhz,dmso-d6)δ8.33(brd,j=8.0hz,1h),8.16(brd,j=7.6hz,1h),8.08-7.94(m,2h),7.87(s,1h),7.82-7.70(m,2h),7.45(dd,j=8.0,10.1hz,1h),6.71(brs,2h),4.69(brt,j=5.2hz,1h),4.43(brs,2h),3.66-3.47(m,2h),2.66(brt,j=6.8hz,2h),2.25-2.15(m,3h),2.13-1.96(m,3h)。ms(es+)m/e455(m+h)+。[0758]实施例26(m45)[0759]8-氟萘-1-硫代碳酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0760][0761]1hnmr(400mhz,dmso-d6)δ8.20(brd,j=8.4hz,1h),7.98(s,1h),7.91-7.83(m,2h),7.73-7.58(m,2h),7.56-7.29(m,2h),6.81(brs,2h),4.73(brs,1h),4.46(brs,2h),3.55(brs,2h),2.69(brt,j=6.4hz,2h),2.20(s,3h),2.18(s,3h)。ms(es+)m/e455(m+h)+。[0762]实施例27(m46)[0763]8-甲基萘-1-硫代碳酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0764][0765]1hnmr(400mhz,dmso-d6)δ8.14(dd,j1=1.6,j2=8.0hz,1h),7.98(s,1h),7.91-7.86(m,2h),7.59-7.47(m,4h),6.83(brs,2h),4.75(brt,j=5.2hz,1h),4.46(brs,2h),3.54(q,j=6.4hz,2h),2.70-2.64(m,2h),2.48(s,3h),2.19(d,j=5.6hz,6h)。ms(es+)m/e451(m+h)+。[0766]实施例28(m47)[0767]4-甲氧基萘-1-硫代碳酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0768][0769]1hnmr(400mhz,dmso-d6)δ8.42(d,j=8.0hz,1h),8.26(d,j=0.4hz,1h),8.05(d,j=8.4hz,1h),7.96(s,1h),7.87(s,1h),7.68-7.65(m,1h),7.65-7.61(m,1h),7.08(d,j=8.4hz,1h),6.71(brs,2h),4.69(brt,j=5.6hz,1h),4.43(brs,2h),4.08(s,3h),3.55-3.50(m,2h),2.66-2.63(m,2h),2.18(s,3h),2.14(s,3h)。ms(es+)m/e467(m+h)+。[0770]实施例29(m49)[0771]萘-2-硫代碳酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0772][0773]1hnmr(400mhz,dmso-d6)δ8.41(s,1h),8.18(brd,j=8.0hz,1h),8.06-8.02(m,2h),7.95(s,1h),7.85(s,1h),7.76-7.64(m,3h),6.64(brs,2h),4.67(brt,j=5.6hz,1h),4.41(brs,2h),3.52(q,j=6.4hz,2h),2.62(brt,j=6.8hz,2h),2.18(s,3h),2.14(s,3h)。ms(es+)m/e437(m+h)+。[0774]实施例30(m50)[0775]5,5,8,8-四甲基-5,6,7,8-四氢萘-2-硫代碳酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0776][0777]1hnmr(400mhz,dmso-d6)δ7.84(d,j=14.4hz,2h),7.64(s,1h),7.51-7.46(m,2h),6.63(s,2h),4.63(t,j=4.2hz,1h),4.38(s,2h),3.45(d,j=5.6hz,2h),2.56(t,j=6.4hz,2h),2.20(s,2h),2.13(s,2h),1.65(s,3h),1.25(s,12h)。ms(es+)m/e497(m+h)+。[0778]实施例31(m51)[0779]1-溴萘-2-硫代碳酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0780][0781]1hnmr(400mhz,dmso-d6)δ8.28(d,j=8.8hz,2h),8.12-8.09(m,2h),7.98(s,1h),7.88(s,1h),7.80-7.76(m,1h),7.74-7.72(m,1h),7.46(d,j=8.4hz,2h),6.75(s,2h),4.72(t,j=5.6hz,1h),4.45(s,2h),3.55(q,j=6.8hz,2h),2.68(t,j=6.4hz,2h),2.20(s,3h),2.17(s,3h)。ms(es+)m/e516(m+h)+。[0782]实施例32(m52)[0783]6-甲氧基萘-2-硫代碳酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0784][0785]1hnmr(400mhz,dmso-d6)δ8.33(d,j=1.2hz,1h),8.08(d,j=8.8hz,1h),7.94-7.83(m,3h),7.70(dd,j1=1.6,j2=8.4hz,1h),7.43(d,j=2.0hz,1h),7.28(dd,j1=2.4,j2=8.8hz,1h),6.76-6.55(m,2h),4.65(t,j=5.6hz,1h),4.40(brs,2h),3.92(s,3h),3.53-3.46(m,2h),2.60(brt,j=6.8hz,2h),2.16(s,3h),2.14(s,3h)。ms(es+)m/e467(m+h)+。[0786]实施例33(m53)[0787](3r,5r,7r)-金刚烷-1-硫代碳酸s-((z)-2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0788][0789]1hnmr(400mhz,dmso-d6)δ7.79(s,1h),7.74(s,1h),6.75(brs,2h),4.60(t,j=5.6hz,1h),4.35(brs,2h),3.44-3.38(m,2h),2.41(t,j=6.8hz,2h),2.28(s,3h),2.08(s,3h),1.98(brs,3h),1.84-1.75(m,1h),1.71-1.62(m,11h)。ms(es+)m/e445(m+h)+。[0790]实施例34(m54)[0791]2-苯基硫代丙酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0792][0793]1hnmr(400mhz,dmso-d6)δ7.77(s,1h),7.73(s,1h),7.34-7.24(m,5h),6.64(s,2h),4.55(t,j=5.6hz,1h),4.40-4.24(m,2h),3.82(m,1h),3.29-3.28(m,2h),2.48-2.39(m,1h),2.32-2.28(m,1h),2.28(s,3h),1.34-1.30(d,j=7.6hz,3h)。ms(es+)m/e415(m+h)+。[0794]实施例35(m55)[0795]2,2-二甲基-3-苯基硫代丙酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0796][0797]1hnmr(400mhz,dmso-d6)δ7.78(s,1h),7.68(s,1h),7.27-7.20(m,3h),7.09(m,2h),6.71(s,1h),4.61(t,j=5.6hz,1h),4.34(s,1h),3.42ꢀ‑3.36(m,2h),2.73(s,2h),2.43(t,j=6.8hz,2h),2.25(s,2h),2.07(s,3h),1.02(s,6h)。ms(es+)m/e443(m+h)+。[0798]实施例36(m57)[0799]1-甲基环己烷-1-硫代碳酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0800][0801]1hnmr(400mhz,dmso-d6)δ7.79(s,1h),7.75(s,1h),6.70(s,2h),4.61(t,j=5.6hz,1h),4.34(s,2h),3.45-3.35(m,2h),2.43(brt,j=6.8hz,2h),2.27(s,3h),2.08(s,3h),1.78(dd,j=6.8,9.8hz,2h),1.49-1.24(m,8h),1.05(s,3h)。ms(es+)m/e407(m+h)+。[0802]实施例37(m58)[0803]2,2-二苯基硫代丙酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0804][0805]1hnmr(400mhz,dmso-d6)δ7.77(d,j=3.2hz,2h),7.35-7.25(m,6h),7.16-7.08(m,4h),6.73(brs,2h),4.58(t,j=5.6hz,1h),4.31(brs,2h),3.32-3.28(m,2h),2.41(brt,j=6.8hz,2h),2.26(s,3h),2.05(s,3h),1.84(s,3h)。ms(es+)m/e491(m+h)+。[0806]实施例38(m59)[0807]3-甲基-2-苯基硫代丁酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0808][0809]1hnmr(400mhz,dmso-d6)δ7.77(s,1h),7.73(s,1h),7.35-7.30(m,2h),7.29-7.21(m,3h),6.64(s,2h),4.55(t,j=5.6hz,1h),4.25(s,2h),3.45-3.41(m,1h),3.29-3.17(m,2h),2.48-2.39(m,1h),2.27-2.20(m,5h),1.99(s,3h),0.92(d,j=6.4hz,3h),0.61(d,j=6.8hz,3h)。ms(es+)m/e443(m+h)+。[0810]实施例39(m62)[0811]2-甲基-2,3-二氢-1h-茚-2-硫代碳酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0812][0813]1hnmr(400mhz,dmso-d6)δ7.79(s,2h),7.21-7.13(m,4h),6.72(s,2h),4.62-4.59(t,j=5.6hz,1h),4.35(s,1h),3.43-3.38(m,2h),3.20(d,j=16.0hz,2h),2.73(d,j=16.0hz,2h),2.44(t,j=6.8hz,2h),2.22(s,3h),2.09(s,3h),1.21(s,3h)。ms(es+)m/e441(m+h)+。[0814]实施例40(m63)[0815]2-甲基-2-(萘-2-基)硫代丙酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0816][0817]1hnmr(400mhz,dmso-d6)δ7.90-7.89(m,1h),7.88-7.85(m,3h),7.77(s,1h),7.73(s,1h),7.53-7.51(m,2h),7.35-7.33(m,1h),6.71(s,2h),4.50(t,j=5.6hz,1h),4.31(s,2h),3.26(q,j=5.6hz,2h),2.38(t,j=6.8hz,2h),2.22(s,3h),2.04(s,3h),1.53(s,6h)。ms(es+)m/e479(m+h)+。[0818]实施例41(m64)[0819]2,2-二苯基硫代乙酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0820][0821]1hnmr(400mhz,dmso-d6)δ7.77(d,j=3.2hz,2h),7.39-7.23(m,12h),6.78-6.57(m,2h),5.29(s,1h),4.63-4.51(m,1h),4.31(brs,2h),2.21(s,3h),2.02(s,3h)。ms(es+)m/e477(m+h)+。[0822]实施例42(m65)[0823]1-(3-溴苯基)环丙烷-1-硫代碳酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0824][0825]1hnmr(400mhz,dmso-d6)δ7.74(s,1h),7.71(s,1h),7.55-7.52(m,2h),7.39-7.37(m,2h),6.71(s,2h),4.55-4.52(m,1h),4.31(s,2h),3.37-3.35(m,1h),2.41-2.34(m,2h),2.37(s,3h),2.04(s,3h),1.40-1.37(m,2h),1.22-1.19(s,2h)。ms(es+)m/e506(m+h)+。[0826]实施例43(m66)[0827]3,5-二氯-[1,1'-联苯]-4-硫代碳酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0828][0829]1hnmr(400mhz,dmso-d6)δ7.98(s,1h),7.89(s,3h),7.78(dd,j1=1.6,j2=8.0hz,2h),7.58-7.45(m,3h),6.92(m,2h),4.74(t,j=5.6hz,1h),4.43(brs,2h),3.55-3.48(m,2h),2.67(brd,j=1.6hz,2h),2.22(s,3h),2.15(s,3h)。ms(es+)m/e532(m+h)+。[0830]实施例44(m67)[0831]4-(叔丁基)-2,6-二甲基硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0832][0833]1hnmr(400mhz,dmso-d6)δ7.95(s,1h),7.83(s,1h),7.13-7.08(m,2h),6.75(s,2h),4.75-4.72(m,1h),4.40(s,2h),3.49-3.44(m,2h),2.68(m,1h),2.26(s,3h),2.20(s,6h),2.15(s,3h),1.24(s,9h)。ms(es+)m/e471(m+h)+。[0834]实施例45(m68)[0835]3-氯-[1,1'-联苯]-4-硫代碳酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0836][0837]1hnmr(400mhz,dmso-d6)δ7.92(s,1h),7.90-7.84(m,2h),7.80-7.73(m,3h),7.65(d,j=8.0hz,1h),7.57-7.45(m,3h),6.96-6.56(m,2h),4.70(t,j=5.6hz,1h),4.43(brs,2h),3.53-3.46(m,2h),2.61(brt,j=6.8hz,2h),2.21(s,3h),2.16(s,3h)。ms(es+)m/e498(m+h)+。[0838]实施例46(m70)[0839]3,5-二叔丁基硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0840][0841]1hnmr(400mhz,dmso-d6)δ7.88(s,1h),7.83(s,1h),7.74(t,j=2.0hz,1h),7.55(d,j=2.0hz,1h),6.60(s,2h),4.65(t,j=5.6hz,1h),4.39(s,2h),3.57-3.42(m,2h),2.57(t,j=6.8hz,2h),2.20(s,3h),2.15(s,3h),1.32(s,18h)。ms(es+)m/e499(m+h)+。[0842]实施例47(m72)[0843][1,1'-联苯]-3-硫代碳酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0844][0845]1hnmr(400mhz,dmso-d6)δ7.98(m,1h),7.93(s,1h),7.91-7.90(m,1h),7.84(s,1h),7.73-7.71(m,3h),7.63(m,1h),7.55-7.51(m,2h),7.44(m,1h),6.64(s,2h),4.64-4.65(m,2h),4.40(s,2h),3.52-3.48(m,2h),2.61-2.51(m,2h),2.21(s,3h),2.13(s,3h)。ms(es+)m/e463(m+h)+。[0846]实施例48(m73)[0847]4-苯氧基硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0848][0849]1hnmr(400mhz,dmso-d6)δ7.87(s,1h),7.82(s,1h),7.77(s,1h),7.75(s,1h),7.50-7.46(m,2h),7.27(m,1h),7.15(d,j=8hz,2h),7.04(d,j=8hz,2h),6.64(s,2h),4.64-4.61(m,2h),4.38(s,2h),3.48-3.43(m,2h),2.58-2.52(m,2h),2.18(s,3h),2.13(s,3h)。ms(es+)m/e463(m+h)+。[0850]实施例49(m76)[0851]二苯并[b,d]呋喃-2-硫代碳酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0852][0853]1hnmr(400mhz,dmso-d6)δ8.57(s,1h),8.35-8.34(d,j=4hz,1h),7.96ꢀ‑7.90(m,5h),7.79-7.77(m,1h),7.61-7.48(m,1h),6.65(m,2h),4.70(m,1h),4.41(s,1h),3.54(m,2h),2.63(m,2h),2.17(s,3h),2.16(s,6h)。ms(es+)m/e477(m+h)+。[0854]实施例50(m79)[0855]苯并[b]噻吩-5-硫代碳酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0856][0857]1hnmr(400mhz,dmso-d6)δ8.31(s,1h),8.15(d,j=8.4hz,1h),7.94-7.93(m,2h),7.84(s,1h),7.67-7.65(m,2h),6.63(s,2h),4.67-4.64(m,2h),4.40(s,2h),3.51-3.47(m,2h),2.67-2.58(m,2h),2.16(s,3h),2.14(s,3h)。ms(es+)m/e443(m+h)+。[0858]实施例51(m82)[0859]4-(2-甲氧基乙氧基)硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0860][0861]1hnmr(400mhz,dmso-d6)δ7.88(s,1h),7.83(s,1h),7.73-7.69(m,2h),7.08-7.04(m,2h),6.64(s,2h),4.66-4.63(m,2h),4.38(s,2h),4.21-4.18(m,2h),3.69-3.68(m,2h),3.47(m,2h),3.34(s,3h),2.56(m,2h),2.25(s,3h),2.20(s,3h)。ms(es+)m/e461(m+h)+。[0862]实施例52(m88)[0863](e)-3-(萘-2-基)硫代丙-2-烯s-((z)-2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0864][0865]1hnmr(400mhz,dmso-d6)δ8.26(s,1h),8.00-7.94(m,4h),7.90(s,1h),7.84(s,1h),7.59-7.56(m,3h),6.95(d,j=15.6hz,1h),6.68(s,2h),4.69(s,1h),4.39(s,2h),3.48(t,j=7.2hz,2h),2.57(t,j=6.4hz,2h),2.22(s,3h),2.12(s,3h)。ms(es+)m/e463(m+h)+。[0866]实施例53(m108)[0867]6-甲氧基萘-1-硫代碳酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0868][0869]1hnmr(400mhz,dmso-d6)δ8.13(d,j=9.6hz,1h),8.09(d,j=8.4hz,1h),7.97(s,1h),7.87(s,1h),7.74(d,j=6.8hz,1h),7.55(t,j=6.8hz,1h),7.45(d,j=2.4hz,1h),7.29(dd,j1=2.8hz,j2=9.2hz,1h),6.73(s,2h),4.71(s,1h),4.43(s,2h),3.89(s,3h),3.52(s,2h),2.66(t,j=6.8hz,2h),2.18(s,3h),2.13(s,3h)。ms(es+)m/e467(m+h)+。[0870]实施例54(m109)[0871]4-乙氧基萘-1-硫代碳酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0872][0873]1hnmr(400mhz,dmso-d6)δ8.42(d,j=8.4hz,1h),8.26(d,j=8.0hz,1h),8.03(d,j=8.4hz,1h),7.96(s,1h),7.87(s,1h),7.67(t,j=1.2hz,1h),7.65-7.60(m,1h),7.05(d,j=8.4hz,1h),6.70(s,2h),4.68(t,j=9.2hz,1h),4.42(s,1h),4.32(q,j=7.2hz,2h),3.51(q,j=6.4hz,2h),2.64(t,j=6.8hz,2h),2.17(s,3h),2.13(s,3h),1.50(t,j=6.8hz,3h)。ms(es+)m/e481(m+h)+。[0874]实施例55(m110)[0875]4-乙基萘-1-硫代碳酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0876][0877]1hnmr(400mhz,dmso-d6)δ8.28-8.26(m,1h),8.19-8.18(m,1h),7.97(s,1h),7.87-7.85(m,1h),7.67-7.64(m,1h),7.48(d,j=7.6hz,1h),6.74(s,2h),4.70(t,j=5.6hz,1h),4.43(s,1h),3.52(q,j=6.0hz,2h),3.14(q,j=7.2hz,2h),2.66(t,j=6.8hz,2h),2.18(s,3h),2.14(s,3h),1.31(t,j=7.6hz,3h)。ms(es+)m/e465(m+h)+。[0878]实施例56(m111)[0879]5-溴萘-1-硫代碳酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0880][0881]1hnmr(400mhz,dmso-d6)δ8.44(d,j=8.8hz,1h),8.20(d,j=8.8hz,1h),8.06-7.95(m,3h),7.88(s,1h),7.79(dd,j1=7.2,j2=8.4hz,1h),7.58(dd,j1=7.6,j2=8.4hz,1h),6.74(brs,2h),4.70(t,j=5.6hz,1h),4.45(brs,2h),3.56-3.49(m,2h),2.68(brt,j=6.8hz,2h),2.21-2.16(m,3h),2.11(s,3h)。ms(es+)m/e516(m+h)+。[0882]实施例57(m114)[0883]4-(叔丁基)硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0884][0885]1hnmr(400mhz,dmso-d6)δ7.90-7.82(m,2h),7.68(d,j=8.4hz,2h),7.59-7.52(m,2h),6.84-6.54(m,2h),4.67(brs,1h),4.38(brs,2h),4.03(q,j=7.2hz,1h),3.45(brs,2h),2.56(brt,j=6.8hz,2h),2.27-2.07(m,6h),1.30(s,9h)。ms(es+)m/e443(m+h)+。[0886]实施例58(m115)[0887]4-(叔丁基)-2-乙氧基硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯2-烯-3-基)硫代)甲酯[0901][0902]1hnmr(400mhz,dmso-d6)δ8.97-8.87(m,2h),8.77-8.70(m,1h),8.52(s,1h),8.19(d,j=8.0hz,1h),7.98(s,1h),7.90-7.81(m,2h),7.80-7.73(m,3h),6.74(brs,2h),5.41(s,2h),4.78(t,j=5.6hz,1h),4.35(brs,2h),3.63-3.50(m,2h),2.74(brt,j=7.2hz,2h),2.24(s,3h),1.98(s,3h)。ms(es+)m/e517(m+h)+。[0903]实施例62(m99)[0904]5,5,8,8-四甲基-5,6,7,8-四氢萘-2-甲酸(z)-((2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)硫代)甲酯[0905][0906]1hnmr(400mhz,dmso-d6)δ7.93(s,1h),7.89-7.85(m,1h),7.77(s,1h),7.66(dd,j1=2.0,1h),7.51-7.46(m,1h),6.73(m,2h),5.24(s,2h),4.69(t,j=5.6hz,1h),4.44-4.18(m,2h),3.57-3.44(m,2h),2.67(brt,j=6.8hz,2h),2.29-2.24(m,3h),1.94(s,3h),1.66(s,4h),1.25(s,12h)。ms(es+)m/e527(m+h)+。[0907]实施例63(m100)[0908]2-乙氧基-1-萘甲酸(z)-((2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)硫代)甲酯[0909][0910]1hnmr(400mhz,dmso-d6)δ8.07(d,j=8.8hz,1h),7.95-7.90(m,2h),7.80(s,1h),7.62-7.49(m,3h),7.43(m,1h),6.73(brs,2h),5.33(s,2h),4.65(t,j=5.6hz,1h),4.35(brs,2h),4.27-4.21(m,2h),3.55-3.44(m,2h),2.61(brt,j=6.8hz,2h),2.28(s,3h),1.95(s,3h),1.31(t,j=7.2hz,3h)。ms(es+)m/e511(m+h)+。[0911]实施例64(m101)[0912]2,2-二甲基-3-(萘-2-基)丙酸(z)-((2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)硫代)甲酯[0913][0914]1hnmr(400mhz,dmso-d6)δ7.90(s,1h),7.88-7.78(m,4h),7.64-7.58(m,1h),7.51-7.44(m,2h),7.28-7.19(m,1h),6.78(m,2h),4.95(brs,2h),4.66(t,j=5.6hz,1h),4.33(brs,2h),3.50-3.41(m,2h),3.01-2.92(m,2h),2.48(brs,2h),2.28(m,3h),1.91(s,3h),1.16-1.12(m,6h)。ms(es+)m/e523(m+h)+。[0915]实施例65(m103)[0916]2,2-二苯基丙酸(z)-((2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)硫代)甲酯[0917][0918]1hnmr(400mhz,dmso-d6)δ7.78(s,1h),7.64(s,1h),7.28-7.34(m,6h),7.12-7.36(m,4h),6.72-6.70(m,2h),5.04(brs,2h),4.60(t,j=5.6hz,1h),4.27(brs,2h),3.28-3.32(m,2h),2.38-2.35(m,2h),2.27(s,3h),1.88-1.85(m,6h)。ms(es+)m/e521(m+h)+。[0919]实施例66(m105)[0920]2,2,2-三苯基乙酸(z)-((2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)硫代)甲酯[0921][0922]1hnmr(400mhz,dmso-d6)δ7.89(s,1h),7.80(s,1h),7.34-7.28(m,11h),7.11-7.09(m,7h),6.77-6.72(m,2h),5.39(brs,2h),4.56(t,j=5.6hz,1h),4.33(brs,2h),3.20-3.19(m,2h),2.28(s,3h),2.08-1.99(m,2h),1.89(s,3h)。ms(es+)m/e583(m+h)+。[0923]实施例67(m107)[0924]2-甲基-2-(萘-2-基)丙酸(z)-((2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)硫代)甲酯[0925][0926]1hnmr(400mhz,dmso-d6)δ7.92-7.82(m,4h),7.76(s,1h),7.70-7.64(m,1h),7.53-7.46(m,2h),7.44-7.37(m,1h),6.69(brd,j=12.4hz,2h),4.96(s,2h),4.59(t,j=5.6hz,1h),4.35-4.12(m,2h),3.32-3.25(m,2h),2.34(brt,j=6.8hz,2h),2.29-2.20(m,3h),1.77(s,3h),1.64-1.57(m,6h)。ms(es+)m/e509(m+h)+。[0927]实施例68(m126)[0928]2-氟-6-苯氧基硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0929][0930]步骤1.2-氟-6-苯氧基苯甲酸[0931][0932]向2-溴-6-氟苯甲酸(5.00g,22.8mmol,1.00当量)和苯酚(3.87g,41.1mmol,3.61ml,1.80当量)于dmf(100ml)中的溶液中添加cui(434mg,2.28mmol,0.10当量)和cs2co3(22.3g,68.5mmol,3.00当量)。将混合物在100℃下在n2下搅拌10小时,冷却至室温,用水(300ml)稀释并用乙酸乙酯(200ml×2)洗涤。水相用hcl(2m)调节至ph~1,并用乙酸乙酯(300ml×2)萃取。合并的有机相用盐水(100ml×2)洗涤,经na2so4干燥,过滤并真空浓缩,得到粗产物,将其通过反相hplc(含5%~55%乙腈的水,0.1%hcl)纯化并真空浓缩以去除乙腈。残余物用乙酸乙酯(300ml×2)萃取。合并的有机相用盐水(100ml×2)洗涤,经na2so4干燥,过滤并真空浓缩,得到呈黄固体状的标题化合物(1.10g,4.74mmol,21%产率)。1hnmr(400mhz,dmso-d6)δ7.47-7.36(m,3h),7.20-7.16(m,1h),7.13-7.06(m,1h),7.03(dd,j1=0.80hz,j2=8.80hz,2h),6.74(d,j=8.40hz,1h)。ms(es+)m/e233(m+h)+。[0933]步骤2.2-氟-6-苯氧基苯甲酰氯[0934][0935]在25℃下向2-氟-6-苯氧基苯甲酸(500mg,2.15mmol,1.00当量)于dcm(10.0ml)和dmf(1.57mg,21.5μmol,1.66μl,0.01当量)中的溶液中逐滴添加(cocl)2(328mg,2.58mmol,226μl,1.20当量)。将反应混合物在25℃下搅拌0.5小时。反应物用无水meoh淬灭并减压浓缩,得到呈黄油状的标题化合物(540mg,粗物质),其不经进一步纯化即直接用于下一步。[0936]步骤3.2-氟-6-苯氧基硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0937][0938]1hnmr(400mhz,dmso-d6)δ7.93(s,1h),7.83(s,1h),7.58-7.48(m,1h),7.46-7.39(m,1h),7.24-7.17(m,1h),7.13-7.02(m,1h),6.78(d,j=8.40hz,1h),6.42(s,2h),4.47-4.25(m,1h),3.47(brd,j=5.20hz,1h),2.58(brt,j=6.80hz,1h),2.29(s,3h),2.05(s,1h)。ms(es+)m/e497(m+h)+。[0939]实施例69至99:使用与制备m126基本上相同的程序和适当的起始材料合成以下化合物。[0940]实施例69(m113)[0941]2-苯氧基硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0942][0943]1hnmr(400mhz,dmso-d6)δ7.83(s,1h),7.79(s,1h),7.66-7.56(m,2h),7.43-7.36(m,2h),7.27(dt,j1=0.8,j2=7.6hz,1h),7.19-7.12(m,1h),7.01-6.95(m,3h),6.78-6.59(m,2h),4.57(t,j=5.6hz,1h),4.34(brs,2h),3.36(brd,j=6.0hz,2h),2.43(t,j=6.4hz,2h),2.16(s,3h),2.08(s,3h)。ms(es+)m/e479(m+h)+。[0944]实施例70(m127)[0945]2-氯-6-苯氧基硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0946][0947]1hnmr(400mhz,dmso-d6)δ7.91(s,1h),7.81(s,1h),7.53-7.45(m,1h),7.44-7.37(m,2h),7.33(brd,j=8.00hz,1h),7.19(brt,j=8.00hz,1h),7.08-6.97(m,2h),6.90(brd,j=8.40hz,1h),6.83-6.58(m,2h),4.62(brt,j=5.20hz,1h),4.35(brs,2h),3.41-3.37(m,2h),2.59-2.54(m,2h),2.27(s,3h),2.07(s,3h)。ms(es+)m/e514(m+h)+。[0948]实施例71(m128)[0949]2-甲基-6-苯氧基硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0950][0951]1hnmr(400mhz,dmso-d6)δ7.91(s,1h),7.79(s,1h),7.40-7.31(m,3h),7.16-7.05(m,2h),6.98-6.92(m,2h),6.80-6.60(m,3h),4.57(t,j=5.20hz,1h),4.34(brs,2h),3.37-3.33(m,2h),2.53-2.51(m,2h),2.26(s,3h),2.24(s,3h),2.06(s,3h)。ms(es+)m/e493(m+h)+。[0952]实施例72(m129)[0953]2-(苯甲氧基)-6-氟硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0954][0955]1hnmr(400mhz,dmso-d6)δ7.91(s,1h),7.80(s,1h),7.50-7.25(m,7h),7.04(d,j=8.40hz,1h),6.89(t,j=8.80hz,1h),6.77-6.52(m,2h),5.21(s,2h),4.63(t,j=5.60hz,1h),4.33(s,2h),3.43-3.38(m,2h),2.59-2.55(m,2h),2.26(s,3h),2.05(s,3h)。ms(es+)m/e511(m+h)+。[0956]实施例73(m130)[0957]2-(3-氯苯氧基)-6-氟硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0958][0959]1hnmr(400mhz,dmso-d6)δ7.86(s,1h),7.80(s,1h),7.63-7.55(m,1h),7.46-7.40(m,1h),7.28-7.18(m,2h),7.13(t,j=2.00hz,1h),6.98(dd,j1=2.00hz,j2=8.40hz,1h),6.92(d,j=8.40hz,1h),6.73-6.57(m,2h),4.64(t,j=5.60hz,1h),4.34(s,2h),3.40(brs,2h),2.60-2.58(m,2h),2.26(s,3h),2.06(s,3h)。ms(es+)m/e532(m+h)+。[0960]实施例74(m131)[0961]5-氯-2-苯氧基硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0962][0963]1hnmr(400mhz,dmso-d6)δ7.85(s,1h),7.80(s,1h),7.61(dd,j=12.0hz,1h),7.58(d,j=4.00hz,1h),7.45-7.39(m,2h),7.22-7.16(m,1h),7.04(d,j=7.60hz,2h),6.97(d,j=8.80hz,1h),6.76-6.73(m,2h),4.61-4.56(m,1h),4.35(s,2h),3.43-3.38(m,2h),2.49-2.45(m,2h),2.17(s,3h),2.10(s,3h)。ms(es+)m/e514(m+h)+。[0964]实施例75(m133)[0965]2-(2-氯苯氧基)-4-甲基硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0966][0967]1hnmr(400mhz,dmso-d6)δ7.82(s,1h),7.78(s,1h),7.60-7.54(m,2h),7.35(dt,j1=1.60hz,j2=7.8hz,1h),7.21(dt,j=1.60hz,j2=8.00hz,1h),7.10(d,j=8.00hz,1h),6.99(dd,j1=1.60hz,j2=8.00hz,1h),6.70-6.60(m,3h),4.57(t,j=5.60hz,1h),4.33(brs,2h),3.43-3.37(m,2h),2.45-2.41(m,2h),2.28(s,3h),2.16(s,3h),2.06(s,3h)。ms(es+)m/e528(m+h)+。[0968]实施例76(m134)[0969]5-氯-2-(4-氟苯氧基)硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0970][0971]1hnmr(400mhz,dmso-d6)δ7.84(s,1h),7.79(s,1h),7.65-7.63(m,2h),7.29-7.24(m,2h),7.13-7.11(m,2h),6.66(d,j=7.20hz,1h),6.64(brs,2h),5.60(t,j=5.60hz,1h),4.35(s,2h),3.42-3.39(m,2h),2.56-2.55(m,2h),2.15(s,3h),2.11(s,3h)。ms(es+)m/e532(m+h)+。[0972]实施例77(m135)[0973]2-(3-氰基苯氧基)硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0974][0975]1hnmr(400mhz,dmso-d6)δ7.81(s,1h),7.78(s,1h),7.72-7.62(m,2h),7.61-7.54(m,2h),7.46-7.35(m,2h),7.28-7.20(m,1h),7.14(d,j=7.60hz,1h),6.69(brs,2h),4.58(t,j=5.60hz,1h),4.34(brs,2h),3.45-3.38(m,2h),2.42-2.35(m,2h),2.15(s,3h),2.08(s,3h)。ms(es+)m/e504(m+h)+。[0976]实施例78(m136)[0977]2-(2-氯苯氧基)硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0978][0979]1hnmr(400mhz,dmso-d6)δ7.85(s,1h),7.80(s,1h),7.64(dd,j1=1.60hz,j2=7.60hz,1h),7.61-7.55(m,2h),7.40-7.33(m,1h),7.31-7.25(m,1h),7.24-7.19(m,1h),7.06-7.00(m,1h),6.86(d,j=7.60hz,1h),6.67(brs,2h),4.59(t,j=5.60hz,1h),4.35(brs,2h),3.42-3.35(m,2h),2.46-2.44(m,2h),2.16(s,3h),2.08(s,3h)。ms(es+)m/e514(m+h)+。[0980]实施例79(m137)[0981]2-(2-溴苯氧基)硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0982][0983]1hnmr(400mhz,dmso-d6)δ7.85(s,1h),7.80(s,1h),7.73(dd,j1=1.60hz,j2=8.00hz,1h),7.64(dd,j1=1.60hz,j2=8.00hz,1h),7.60-7.54(m,1h),7.44-7.37(m,1h),7.28(t,j=7.60hz,1h),7.18-7.12(m,1h),7.00(dd,j1=1.60hz,,j2=8.00hz,1h),6.84(d,j=8.40hz,1h),6.75-6.60(m,2h),4.59(t,j=6.00hz,1h),4.35(brs,2h),3.40(q,j=6.80hz,2h),2.47-2.43(m,2h),2.16(s,3h),2.08(s,3h)。ms(es+)m/e558(m+h)+。[0984]实施例80(m138)[0985]2-(2,6-二氯苯氧基)硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0986][0987]1hnmr(400mhz,dmso-d6)δ8.30-8.25(m,1h),8.13(dd,j1=3.20hz,j2=6.4hz,1h),7.98(s,1h),7.88-7.80(m,2h),7.69-7.64(m,2h),7.47(d,j=7.60hz,1h),6.71(brs,2h),4.69(brt,j=5.60hz,1h),4.43(brs,2h),3.55-3.47(m,2h),2.72(s,3h),2.66(brt,j=6.80hz,2h),2.18(s,3h),2.13(s,3h)。ms(es+)m/e457(m+h)+。[0988]实施例81(m139)[0989]2-(3-(叔丁基)苯氧基)硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0990][0991]1hnmr(400mhz,dmso-d6)δ7.86(s,1h),7.80(s,1h),7.66-7.54(m,2h),7.34-7.23(m,2h),7.19(brd,j=8.00hz,1h),7.05-6.93(m,2h),6.79-6.56(m,3h),4.58(t,j=5.60hz,1h),4.34(brs,2h),3.40-3.37(m,2h),2.44(brt,j=6.80hz,2h),2.17(s,3h),2.07(s,3h),1.26(s,9h)。ms(es+)m/e535(m+h)+。[0992]实施例82(m140)[0993]2-(萘-2-基氧基)硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0994][0995]1hnmr(400mhz,dmso-d6)δ7.97(d,j=8.80hz,1h),7.91(d,j=7.60hz,1h),7.86-7.81(m,2h),7.77(s,1h),7.72-7.65(m,1h),7.65-7.58(m,1h),7.54-7.41(m,2h),7.37-7.29(m,2h),7.26(dd,j1=2.40hz,j2=8.80hz,1h),7.10(d,j=8.40hz,1h),6.70(brs,2h),4.50(t,j=5.60hz,1h),4.32(brs,2h),3.23(q,j=6.40hz,2h),2.35(brt,j=6.40hz,2h),2.14(s,3h),2.05(s,3h)。ms(es+)m/e529(m+h)+。[0996]实施例83(m141)[0997]2-(喹啉-8-基氧基)硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[0998][0999]1hnmr(400mhz,dmso-d6)δ7.86(s,1h),7.84-7.72(m,2h),7.68-7.59(m,1h),7.49-7.32(m,3h),7.32-7.17(m,2h),7.11-6.84(m,1h),6.83-6.47(m,3h),6.44-6.06(m,1h),4.64-4.40(m,2h),4.13-3.95(m,1h),3.56-3.48(m,2h),2.80-2.70(m,2h),2.28(s,3h),1.83(brs,3h)。ms(es+)m/e530(m+h)+。[1000]实施例84(m142)[1001]2-(2-氯苯氧基)-6-氟硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[1002][1003]1hnmr(400mhz,dmso-d6)δ7.89(s,1h),7.80(s,1h),7.58(dd,j1=1.60hz,j2=8.00hz,1h),7.51-7.45(m,1h),7.41-7.36(m,1h),7.29-7.23(m,1h),7.18-7.08(m,2h),6.87-6.61(m,2h),6.55(d,j=8.40hz,1h),4.61(t,j=5.60hz,1h),4.33(s,2h),3.42-3.38(m,2h),2.57-2.55(m,2h),2.27(s,3h),2.06(d,j=1.60hz,3h)。ms(es+)m/e532(m+h)+。[1004]实施例85(m143)[1005]4-乙氧基-2-(3-氟苯氧基)硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[1006][1007]1hnmr(400mhz,dmso-d6)δ7.79(s,1h),7.77(s,1h),7.69(d,j=8.80hz,1h),7.44-7.36(m,1h),6.98(dt,j1=2.40hz,j2=8.40hz,1h),6.91-6.85(m,1h),6.76(dd,j1=2.00hz,j2=8.00hz,1h),6.65(brd,j=2.00hz,2h),6.54(d,j=2.40hz,1h),4.55(t,j=5.60hz,1h),4.31(brs,2h),4.06(q,j=7.20hz,2h),3.37-3.33(m,2h),2.40(brt,j=6.80hz,1h),2.17(s,3h),2.06(s,3h),1.30(t,j=6.80hz,3h)。ms(es+)m/e541(m+h)+。[1008]实施例86(m145)[1009]4-(叔丁基)-2-苯氧基硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[1010][1011]1hnmr(400mhz,dmso-d6)δ7.89(s,1h),7.83(s,1h),7.64(brd,j=8.40hz,1h),7.40-7.36(m,2h),7.32(brd,j=7.20hz,1h),7.19-7.08(m,1h),7.01(s,1h),6.96(d,j=8.40hz,2h),6.30(brs,2h),4.35(s,2h),4.21-4.06(m,1h),3.50-3.43(m,2h),2.55(brs,2h),2.25(s,3h),2.06(s,3h),1.26(s,9h)。ms(es+)m/e535(m+h)+。[1012]实施例87(m146)[1013]2-((6-(三氟甲基)吡啶-3-基)氧基)硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[1014][1015]1hnmr(400mhz,dmso-d6)δ8.50(d,j=2.40hz,1h),7.89(d,j=8.80hz,1h),7.85-7.63(m,4h),7.50-7.40(m,2h),7.39-7.27(m,1h),6.71(brs,2h),4.59(t,j=5.60hz,1h),4.35(brs,2h),2.59(brd,j=6.80hz,2h),2.40(brt,j=6.40hz,2h),2.16(s,3h),2.09(s,3h)。ms(es+)m/e548(m+h)+。[1016]实施例88(m147)[1017]2-((2,3-二氢苯并[b][1,4]二噁英-6-基)氧基)硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[1018][1019]1hnmr(400mhz,dmso-d6)δ7.85(s,1h),7.80(s,1h),7.65-7.51(m,2h),7.22(t,j=7.60hz,1h),6.93(d,j=8.40hz,1h),6.87(d,j=8.80hz,1h),6.67(brs,2h),6.56(d,j=2.40hz,1h),6.48(dd,j1=2.80hz,j2=8.80hz,1h),4.67-4.54(m,1h),4.35(brs,2h),4.25-4.23(brd,j=2.40hz,4h),3.41(q,j=6.40hz,2h),2.48-4.46(m,2h),2.16(s,3h),2.09(s,3h)。ms(es+)m/e537(m+h)+。[1020]实施例89(m149)[1021]2-氯-4-苯氧基硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[1022][1023]1hnmr(400mhz,dmso-d6)δ7.88(s,1h),7.84(s,1h),7.61(d,j=8.80hz,1h),7.50(t,j=8.00hz,2h),7.33-7.28(m,1h),7.22-7.15(m,3h),6.98(dd,j1=2.40hz,j2=8.80hz,1h),6.79-6.68(m,2h),4.67(t,j=5.60hz,1h),4.45-4.41(m,2h),3.49-3.45(m,2h),2.60-2.58(m,2h),2.20(s,3h),2.15(s,3h)。ms(es+)m/e514(m+h)+。[1024]实施例90(m150)[1025]2-氟-6-甲基-4-苯氧基硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[1026][1027]1hnmr(400mhz,dmso-d6)δ7.91(s,1h),7.83(s,1h),7.49-7.42(m,2h),7.29-7.22(m,1h),7.14(d,j=8.00hz,2h),6.79-6.57(m,4h),4.71(t,j=5.20hz,1h),4.39(brs,2h),3.49-3.43(m,2h),2.60(brs,2h),2.26(m,3h),2.19(s,3h),2.12(s,3h)。ms(es+)m/e511(m+h)+。[1028]实施例91(m151)[1029]4-(3-氯苯氧基)-2-甲基硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[1030][1031]1hnmr(400mhz,dmso-d6)δ7.88(s,1h),7.83(s,1h),7.67(d,j=8.40hz,1h),7.47(t,j=8.00hz,1h),7.30(dd,j1=0.80hz,j2=8.00hz,1h),7.23(t,j=2.00hz,1h),7.09(dd,j1=2.00hz,j2=8.00hz,1h),7.00(brd,j=2.00hz,1h),6.90(brdd,j=2.40hz,j2=8.80hz,1h),6.82-6.59(m,2h),4.65(brt,j=5.60hz,1h),4.40(brs,2h),3.46(q,j=6.40hz,2h),2.58-2.55(m,2h),2.32(s,3h),2.19(s,3h),2.14(s,3h)。ms(es+)m/e528(m+h)+。[1032]实施例92(m152)[1033]2,4-二苯氧基硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[1034][1035]1hnmr(400mhz,dmso-d6)δ8.13(s,1h),7.93(s,1h),7.71(d,j=8.80hz,1h),7.43-7.41(m,5h),7.28-7.18(m,2h),7.09(m,5h),6.79-6.77(m,1h),6.38(d,j=2.40hz,1h),4.70(s,1h),4.48(s,2h),3.42(t,j=6.00hz,2h),2.448-2.44(m,2h),2.20(s,3h),2.16(s,3h)。ms(es+)m/e571(m+h)+。[1036]实施例93(m153)[1037]2-(苯基硫代)硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[1038][1039]1hnmr(400mhz,dmso-d6)δ7.92(s,1h),7.85(s,1h),7.69(dd,j1=1.20hz,j2=8.00hz,1h),7.53-7.40(m,7h),7.34-7.28(m,1h),6.90(d,j=8.00hz,1h),6.86-6.60(m,2h),4.67(t,j=5.60hz,1h),4.44-4.33(m,2h),3.49-3.44(m,2h),2.62-2.55(m,2h),2.20(s,3h),2.14(s,3h)。ms(es+)m/e495(m+h)+。[1040]实施例94(m155)[1041]2-(4-(2-氧代基吡咯烷-1-基)苯氧基)硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[1042][1043]1hnmr(400mhz,dmso-d6)δ7.84(s,1h),7.79(s,1h),7.69-7.63(m,3h),7.62-7.54(m,1h),7.31-7.22(m,1h),7.04-6.99(m,2h),6.96(d,j=8.40hz,1h),6.69(brs,2h),4.59(t,j=5.60hz,1h),4.34(brs,2h),3.82(t,j=7.20hz,2h),3.42-3.37(m,2h),2.49-2.44(m,4h),2.17(s,3h),2.11-2.02(m,5h)。ms(es+)m/e562(m+h)+。[1044]实施例95(m156)[1045]4-(叔丁基)-2-(3-(叔丁基)苯氧基)硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[1046][1047]1hnmr(400mhz,dmso-d6)δ7.83(s,1h),7.79(s,1h),7.60(d,j=8.00hz,1h),7.39-7.30(m,2h),7.16(d,j=7.20hz,1h),6.99(s,2h),6.74-6.66(m,3h),4.62-4.54(m,1h),4.42-4.39(s,2h),2.45-2.40(m,3h),2.17(s,3h),2.06(s,3h),1.24(s,9h),1.21(s,9h)。ms(es+)m/e591(m+h)+。[1048]实施例96(m157)[1049]2-(萘-1-基氧基)硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[1050][1051]1hnmr(400mhz,dmso-d6)δ8.09-8.04(m,1h),8.01-7.96(m,1h),7.84(s,1h),7.80-7.71(m,2h),7.68(dd,j1=1.60hz,j2=8.00hz,1h),7.62-7.52(m,3h),7.47(t,j=8.00hz,1h),7.32-7.24(m,1h),6.97-6.88(m,2h),6.69(brs,2h),4.52(t,j=5.60hz,1h),4.33(brs,2h),3.29-3.26(m,2h),2.39(brt,j=6.40hz,2h),2.15(s,3h),2.05(s,3h)。ms(es+)m/e529(m+h)+。[1052]实施例97(m158)[1053]5-氯-2-(2-氯苯氧基)硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[1054][1055]1hnmr(400mhz,dmso-d6)δ7.87(s,1h),7.81(s,1h),7.64-7.58(m,3h),7.39(t,j=7.20hz,1h),7.27(t,j=7.20hz,1h),7.14(t,j=8.00hz,1h),6.86(d,j=8.40hz,1h),6.63(s,2h),4.63-4.59(m,1h),4.35(s,2h),3.46-3.41(m,2h),2.46-2.44(m,2h),2.17(s,3h),2.10(s,3h)。ms(es+)m/e548(m+h)+。[1056]实施例98(m159)[1057]2-(2-溴苯氧基)-5-氯硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[1058][1059]1hnmr(400mhz,dmso-d6)δ7.87(s,1h),7.81(s,1h),7.78-7.74(m,1h),7.65-7.58(m,2h),7.48-7.42(m,1h),7.25-7.18(m,1h),7.16-7.13(m,1h),6.86(d,j=8.40hz,1h),6.63(s,2h),4.62-4.58(m,1h),4.35(s,2h),3.45-3.40(m,2h),2.46-2.42(s,2h),2.17(s,3h),2.10(s,3h)。ms(es+)m/e592(m+h)+。[1060]实施例99(m160)[1061]2-(2-溴苯氧基)-6-氟硫代苯甲酸(z)-s-(2-(n-((4-氨基-2-甲基嘧啶-5-基)甲基)甲酰胺基)-5-羟基戊-2-烯-3-基)酯[1062][1063]1hnmr(400mhz,dmso-d6)δ7.89(s,1h),7.81(s,1h),7.75(dd,j1=1.20hz,j2=7.60hz,1h),7.56-7.41(m,2h),7.23-7.19(m,1h),7.18-7.08(m,2h),6.63-6.61(m,2h),6.56(d,j=8.80hz,1h),4.64-4.61(m,1h),4.35(s,2h),3.47-3.36(m,2h),2.06(s,3h)。ms(es+)m/e576(m+h)+。[1064]实施例100:结果[1065]为了鉴定在哺乳动物细胞中更有效地打开这些硫胺类似物核糖开关,和/或具有其它特征例如改进的药代动力学参数的化合物,制备了额外化合物(例如,式iv-viii的化合物)并使用含有15d10核糖开关的荧光素酶构建体(luci-15d10,seqidno:93)测试了它们在调节硫胺类似物核糖开关中的活性。[1066]seqidno:93是通过将15d10核糖开关插入荧光素酶报告基因而获得的。大写字母表示荧光素酶编码序列。小写字母表示内含子/选择性外显子/内含子和核糖开关序列。15d10适体编码序列(seqidno:26)加下划线。[1067]seqidno:93:[1068]atggaagacgccaaaaacataaagaaaggcccggcgccattctatccgctggaagatggaaccgctggagagcaactgcataaggctatgaagagatacgccctggttcctggaacaattgcttttacagatgcacatatcgaggtggacatcacttacgctgagtacttcgaaatgtccgttcggttggcagaagctatgaaacgatatgggctgaatacaaatcacagaatcgtcgtatgcagtgaaaactctcttcaattctttatgccggtgttgggcgcgttatttatcggagttgcagttgcgcccgcgaacgacatttataatgaacgtgaattgctcaacagtatgggcatttcgcagcctaccgtggtgttcgtttccaaaaaggggttgcaaaaaattttgaacgtgcaaaaaaagctcccaatcatccaaaaaattattatcatggattctaaaacggattaccagggatttcagtcgatgtacacgttcgtcacatctcatctacctcccggttttaatgaatacgattttgtgccagagtccttcgatagggacaagacaattgcactgatcatgaactcctctggatctactggtctgcctaaaggtgtcgctctgcctcatagaactgcctgcgtgagattctcgcatgccagagatcctatttttggcaatcaaatcattccggatactgcgattttaagtgttgttccattccatcacggttttggaatgtttactacactcggatatttgatatgtggatttcgagtcgtcttaatgtatagatttgaagaagagctgtttctgaggagccttcaggattacaagattcaaagtgcgctgctggtgccaaccctattctccttcttcgccaaaagcactctgattgacaaatacgatttatctaatttacacgaaattgcttctggtggcgctcccctctctaaggaagtcggggaagcggttgccaagaggttccatctgccaggtatcagggtgagtctatgggacccttgatgttttctttccccttcttttctatggttaagttcatgtcataggaaggggagaagtaacagggtacacatattgaccaaatcagggtaattttgcatttgtaattttaaaaaatgctttcttcttttaatatacttttttgtttatcttatttctaatactttccctaatctctttctttcagggcaataatgatacaatgtatcatgccgagtaacgctgtttctctaacttgtaggaatgaattcagatatttccagagaatgaaaaaaaatcttcagtagaaggtaatgtacaggggtccggccttttcatttggcaccggtgagaacatacccttcggacctgttcacggataatgccgctgcagggagtacattacgcaccattctaaagaataacagtgataatttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgtaagaggtttcatattgctaatagcagctacaatccagctaccattctgcttttattttatggttgggataaggctggattattctgagtccaagctaggcccttttgctaatcatgttcatacctcttatcttcctcccacagcaaggatatgggctcactgagactacatcagctattctgattacacccgagggggatgataaaccgggcgcggtcggtaaagttgttccattttttgaagcgaaggttgtggatctggataccgggaaaacgctgggcgttaatcaaagaggcgaactgtgtgtgagaggtcctatgattatgtccggttatgtaaacaatccggaagcgaccaacgccttgattgacaaggatggatggctacattctggagacatagcttactgggacgaagacgaacacttcttcatcgttgaccgcctgaagtctctgattaagtacaaaggctatcaggtggctcccgctgaattggaatccatcttgctccaacaccccaacatcttcgacgcaggtgtcgcaggtcttcccgacgatgacgccggtgaacttcccgccgccgttgttgttttggagcacggaaagacgatgacggaaaaagagatcgtggattacgtcgccagtcaagtaacaaccgcgaaaaagttgcgcggaggagttgtgtttgtggacgaagtaccgaaaggtcttaccggaaaactcgacgcaagaaaaatcagagagatcctcataaaggccaagaagggcggaaagatcgccgtgtaa[1069]式iv化合物首先在hek293细胞中进行测试。如图9a中所示,在hek293细胞中,在用化合物m10、m16、m18、m19或m21处理后,荧光素酶基因表达以剂量依赖性方式增加。与呋喃硫胺的活性相比,m19在诱导荧光素酶表达方面更有效,在hek293细胞中在12.5μm浓度下产生荧光素酶表达的168.7倍增加。此外,这些新化合物在小鼠肝细胞系aml12细胞中进行了测试。如图9b中所示,与来自hek293细胞的观察结果一致,所有化合物均以剂量依赖性方式增加了来自含有15d10核糖开关的构建体的荧光素酶表达。与呋喃硫胺对核糖开关15d10的活性相比,化合物m10、m16、m19和m21比呋喃硫胺更有效。m19和m21在这种类型的细胞中诱导核糖开关15d10调节的荧光素酶表达方面同样有效。[1070]在hek293和aml12细胞中测试了式v和vi的化合物以及作为对照化合物的苯磷硫胺。如图9c中所示,化合物m30、m31、m32和m33以及苯磷硫胺对荧光素酶的表达没有影响,而m26、m27、m28、m29和m34增加了来自luci-15d10构建体的荧光素酶表达,其中m34是hek293细胞中最有效的化合物。相比之下,在aml12细胞中,除m30和m33之外的所有化合物都增加了来自luci-15d10构建体的荧光素酶表达。在这两种细胞类型中,m34始终是这两组化合物中打开核糖开关最有效的诱导剂(图9d)。[1071]进一步测试了相对更有效的化合物在其它人细胞系中调节核糖开关的活性。如图9e中所示,在人arpe-19细胞中,苯磷硫胺和m32在增加核糖开关15d10调节的荧光素酶表达方面均无活性,而m10、m19和m21在增加luci-15d10构建体的荧光素酶表达方面与呋喃硫胺具有同等效力。同样,苯磷硫胺和m32在hepg2细胞中没有活性,而m19、m21和m10在12.5μm浓度下具有相似的效力(图9f)。[1072]使用含有15d10核糖开关的荧光素酶构建体(luci-15d10,seqidno:93)在hek293和aml12细胞中测试了化合物m34至m123和化合物m126至m160在调节硫胺类似物核糖开关方面的活性,其中呋喃硫胺作为对照化合物。响应这些化合物的luci-15d10构建体的荧光素酶表达的增加在表2和表3中示出。[1073]表2.50μm化合物m34至m123的核糖开关15d10调节的荧光素酶表达的增加倍数(计算为来自用鉴定的化合物处理的细胞的荧光素酶信号除以来自未处理细胞的荧光素酶信号的比率)。#=化合物编号。hek=hek293细胞。aml=aml12细胞。ctrl.=呋喃硫胺。[1074][1075]表3.50μm化合物m126至m160的核糖开关15d10调节的荧光素酶表达的增加倍数(计算为来自用鉴定的化合物处理的细胞的荧光素酶信号除以来自未处理细胞的荧光素酶信号的比率)。#=化合物编号。hek=hek293细胞。aml=aml12细胞。[1076][1077]当前第1页12当前第1页12

技术特征:


1.一种用于调节靶基因的表达的多核苷酸盒,其中所述多核苷酸盒包含编码与小分子结合的适体的序列,其中所述适体编码序列包含acx1ggggtccggcx2tx3ttcatttggcx4ccggtgagax5x6ax7acccttx8x9x
10
x
11
cctgttx
12
acggataatgccgcx
13
gc agggagt(seq id no:1),且其中:x1是a或g;x2是c或无核苷酸;x3是t或无核苷酸;x4是a或g;x5是任何核苷酸;x6是任何核苷酸;x7是任何核苷酸;x8是任何核苷酸;x9是c、g或t;x
10
是任何核苷酸;x
11
是a或t;x
12
是c或t;且x
13
是c或t。2.一种用于调节靶基因的表达的多核苷酸盒,其中所述多核苷酸盒包含编码与小分子结合的适体的序列,其中所述适体编码序列包含acx1ggggtccggcx2tx3ttcatttggcgccggtgagax5x6ax7acccttx8x9x
10
x
11
cctgttx
12
acggataatgccgcx
13
gca gggagt(seq id no:2),且其中:x1是a或g;x2是c或无核苷酸;x3是t或无核苷酸;x5是g或t;x6是c或t;x7是c或t;x8是任何核苷酸;x9是g或t;x
10
是a、g或t;x
11
是a或t;x
12
是c或t;且x
13
是c或t。3.一种用于调节靶基因的表达的多核苷酸盒,其中所述多核苷酸盒包含编码与小分子结合的适体的序列,其中所述适体编码序列包含acaggggtccggccttttcatttggcgccggtgagagcac accctttgaacctgttx
12
acggataatgccgcx
13
gcagggagt(seq id no:3),且其中x
12
是c或t;且x
13
是c或t。
4.一种用于调节靶基因的表达的多核苷酸盒,其中所述多核苷酸盒包含编码与小分子结合的适体的序列,其中所述适体编码序列包含acx1ggggtccggccttttcatttggcgccggtgagagcac acccttx8x9x
10
x
11
cctgtttacggataatgccgccgcagggagt(seq id no:4),且其中x1是a或g;x8是任何核苷酸;x9是g或t;x
10
是a、g或t;且x
11
是a或t。5.一种用于调节靶基因的表达的多核苷酸盒,其中所述多核苷酸盒包含编码与小分子结合的适体的序列,其中所述适体编码序列包含acaggggtccggccttttcatttggcgccggtgagax5x6ax7accctttgaacctgtttacggataatgccgccgcagggagt(seq id no:5),且其中x5是g或t;x6是c或t;且x7是c或t。6.一种用于调节靶基因的表达的多核苷酸盒,其中所述多核苷酸盒包含编码与小分子结合的适体的序列,其中所述适体编码序列包含acaggggtccggccttttcatttggcx4ccggtgagax5x6ax7acccttx8x9x
10
acctgttcacggataatgccgctgcaggga gt(seq id no:6),且其中:x4是a或g;x5是任何核苷酸;x6是任何核苷酸;x7是任何核苷酸;x8是任何核苷酸;x9是c或g;且x
10
是任何核苷酸。7.一种用于调节靶基因的表达的多核苷酸盒,其中所述多核苷酸盒包含编码与小分子结合的适体的序列,其中所述适体编码序列包含与选自由seq id no:7-36组成的组的序列至少95%同一的序列。8.如权利要求7所述的多核苷酸盒,其中所述适体编码序列选自由seq id no:7-36组成的组。9.如权利要求8所述的多核苷酸盒,其中所述适体编码序列选自由seq id no:8、9、14-18、21、25、26和30组成的组。10.如权利要求9所述的多核苷酸盒,其中所述适体编码序列包含选自由seq id no:9、14和26组成的组的序列。11.一种编码与小分子结合的适体的核酸序列,其中所述适体编码序列包含acx1ggggtccggcx2tx3ttcatttggcx4ccggtgagax5x6ax7acccttx8x9x
10
x
11
cctgttx
12
acggataatgccgcx
13
gc agggagt(seq id no:1),且其中:
x1是a或g;x2是c或无核苷酸;x3是t或无核苷酸;x4是a或g;x5是任何核苷酸;x6是任何核苷酸;x7是任何核苷酸;x8是任何核苷酸;x9是c、g或t;x
10
是任何核苷酸;x
11
是a或t;x
12
是c或t;且x
13
是c或t。12.如权利要求11所述的核酸序列,其中所述适体编码序列具有以下特性中的一种或多种:x1不是a;x2不是c;x3不是t;x4不是g;x5不是g;x6不是c;x7不是c;x8不是t;x9不是g;x
10
不是a;x
11
不是a;x
12
不是t;以及x
13
不是c。13.如权利要求11所述的核酸序列,其中以下所有者不同时存在于所述适体编码序列中:x1是a;x2是c;x3是t;x4是g;x5是g;x6是c;x7是c;x8是t;x9是g;x
10
是a;x
11
是a;x
12
是t;以及x
13
是c。14.一种编码与小分子结合的适体的核酸序列,其中所述适体编码序列包含acx1ggggtccggcx2tx3ttcatttggcgccggtgagax5x6ax7acccttx8x9x
10
x
11
cctgttx
12
acggataatgccgcx
13
gca gggagt(seq id no:2),且其中:x1是a或g;x2是c或无核苷酸;x3是t或无核苷酸;x5是g或t;x6是c或t;x7是c或t;x8是任何核苷酸;x9是g或t;x
10
是a、g或t;x
11
是a或t;x
12
是c或t;且x
13
是c或t。15.如权利要求14所述的核酸序列,其中所述适体编码序列具有以下特性中的一种或多种:x1不是a;x2不是c;x3不是t;x4不是g;x5不是g;x6不是c;x7不是c;x8不是t;x9不是g;x
10
不是a;x
11
不是a;x
12
不是t;以及x
13
不是c。16.如权利要求14所述的核酸序列,其中以下所有者不同时存在于所述适体编码序列中:x1是a;x2是c;x3是t;x5是g;x6是c;x7是c;x8是t;x9是g;x
10
是a;x
11
是a;x
12
是t;以及x
13

c。17.一种编码与小分子结合的适体的核酸序列,其中所述适体编码序列包含acaggggtccggccttttcatttggcgccggtgagagcac accctttgaacctgttx
12
acggataatgccgcx
13
gcagggagt(seq id no:3),且其中x
12
是c或t;且x
13
是c或t。18.如权利要求17所述的核酸序列,其中所述适体编码序列具有以下特性中的一种或多种:x
12
不是t;以及x
13
不是c。19.如权利要求17所述的核酸序列,其中以下所有者不同时存在于所述适体编码序列中:x
12
是t以及x
13
是c。20.一种编码与小分子结合的适体的核酸序列,其中所述适体编码序列包含acx1ggggtccggccttttcatttggcgccggtgagagcac acccttx8x9x
10
x
11
cctgtttacggataatgccgccgcagggagt(seq id no:4),且其中:x1是a或g;x8是任何核苷酸;x9是g或t;x
10
是a、g或t;且x
11
是a或t。21.如权利要求20所述的核酸序列,其中所述适体编码序列具有以下特性中的一种或多种:x1不是a;x8不是t;x9不是g;x
10
不是a;x
11
不是a。22.如权利要求20所述的核酸序列,其中以下所有者不同时存在于所述适体编码序列中:x1是a;x8是t;x9是g;x
10
是a;x
11
是a;x
12
是t;以及x
13
是c。23.一种编码与小分子结合的适体的核酸序列,其中所述适体编码序列包含acaggggtccggccttttcatttggcgccggtgagax5x6ax7accctttgaacctgtttacggataatgccgccgcagggagt(seq id no:5),且其中x5是g或t;x6是c或t;且x7是c或t。24.如权利要求23所述的核酸序列,其中所述适体编码序列具有以下特性中的一种或多种:x5不是g;x6不是c;以及x7不是c。25.如权利要求23所述的核酸序列,其中以下所有者不同时存在于所述适体编码序列中:x5是g;x6是c;以及x7是c。26.一种编码与小分子结合的适体的核酸序列,其中所述适体编码序列包含acaggggtccggccttttcatttggcx4ccggtgagax5x6ax7acccttx8x9x
10
acctgttcacggataatgccgctgcaggga gt(seq id no:6),且其中:x4是a或g;x5是任何核苷酸;x6是任何核苷酸;x7是任何核苷酸;
x8是任何核苷酸;x9是c或g;且x
10
是任何核苷酸。27.一种编码与小分子结合的适体的核酸序列,其中所述适体编码序列包含与选自由seq id no:7-36组成的组的序列至少95%同一的序列。28.如权利要求27所述的核酸序列,其中所述适体编码序列选自由seq id no:7-36组成的组。29.如权利要求28所述的核酸序列,其中所述适体编码序列选自由seq id no:8、9、14-18、21、25、26和30组成的组。30.如权利要求29所述的核酸序列,其中所述适体编码序列包含选自由seq id no:9、14和26组成的组的序列。31.如权利要求1至10中任一项所述的多核苷酸盒或如权利要求11至30中任一项所述的核酸序列,其中所述适体与具有根据以下任一者的结构的小分子结合或以其它方式响应所述小分子的存在:a)式i:其中:r1选自由以下组成的组:oh、氨基、f、cl、br、磷酸酯基、焦磷酸酯基、-o-c(=o)-c
1-c6烷基、-o-c(=o)-c
2-c6烯基、-o-c(=o)-苯基、-o-c(=o)-杂环、-o-c(=o)-o-c
1-c6烷基、-o-c(=o)-o-c
2-c6烯基、-o-c(=o)-o-苯基和-o-c(=o)-o-杂环;b)式ii:其中:r2选自由以下组成的组:h、c
1-c6烷基、c
2-c6烯基、-(ch2)
n-r6、-c(=o)-r4、-c(=o)-o-r4、-chr
5-o-c(=o)-r4、-s-c
1-c6烷基、-s-c
2-c6烯基、-s-杂环和-s-ch
2-杂环;或r2是

s-[式ii],使得所述化合物形成通过二硫(-s-s-)键连接的两个式ii分子的二聚体;
r3选自由以下组成的组:oh、氨基、f、cl、br、磷酸酯基、焦磷酸酯基、-o-c(=o)-c
1-c6烷基、-o-c(=o)-c
1-c6烯基、-o-c(=o)-苯基、-o-c(=o)-杂环、-o-c(=o)-o-c
1-c6烷基、-o-c(=o)-o-c
1-c6烯基、-o-c(=o)-o-苯基、-o-c(=o)-o-杂环;r4选自由以下组成的组:h、c
1-c6烷基、c
2-c6烯基、c
3-c7环烷基、c
6-c
10
双环基、c
9-c
14
三环基、-(c
1-c6烷基)-芳基、-(c
2-c6烯基)-芳基、芳基、杂芳基和杂环基;r5选自由以下组成的组:h、c
1-c6烷基、c
2-c6烯基、c
3-c7环烷基、芳基、杂芳基和杂环基;r6是羟基、氨基、酰胺基、c
1-c6烷氧基、c
3-c7环烷基、c
6-c
10
双环基、芳基、杂芳基和杂环基;且n是1至8;且其中所述烷基、烯基、环烷基、双环基、三环基、芳基、杂芳基和杂环基中的每一个可未被取代或被1至3个选自由以下组成的组的取代基取代:卤素、羟基、氨基、氰基、酰胺基、磺酰胺、硝基、-sh、c
1-c6烷基、c
2-c6烯基、c
3-c7环烷基、c
6-c
10
双环基、c
1-c6卤烷基、c
1-c6全卤烷基、-o-(c
1-c6烷基)、o-(c
3-c7环烷基)、-o-(c
1-c6卤烷基)、-o-(c
1-c6全卤烷基)、芳基、-o-芳基、-(c
1-c6烷基)-芳基、-o-(c
1-c6烷基)-芳基、-s-(c
1-c6烷基)、-s-(c
3-c7环烷基)、-s-(c
1-c6卤烷基)、-s-(c
1-c6全卤烷基)、-s-芳基、-s-(c
1-c6烷基)-芳基、杂芳基和杂环基;c)式iii:其中:r2选自由以下组成的组:h、c
1-c6烷基、c
2-c6烯基、-(ch2)
n-r6、-c(=o)-r4、-c(=o)-o-r4、-chr
5-o-c(=o)-r4、-s-c
1-c6烷基、-s-c
2-c6烯基、-s-杂环和-s-ch
2-杂环;r
31
选自由oh和磷酸酯基组成的组;r4选自由以下组成的组:h、c
1-c6烷基、c
2-c6烯基、c
3-c7环烷基、c
6-c
10
双环基、c
9-c
14
三环基、-(c
1-c6烷基)-芳基、-(c
2-c6烯基)-芳基、芳基、杂芳基和杂环基;r5选自由以下组成的组:h、c
1-c6烷基、c
2-c6烯基、c
3-c7环烷基、芳基、杂芳基和杂环基;r6是羟基、氨基、酰胺基、c
1-c6烷氧基、c
3-c7环烷基、c
6-c
10
双环基、芳基、杂芳基和杂环基;且n是1至8;且其中所述烷基、烯基、环烷基、双环基、三环基、芳基、杂芳基和杂环基中的每一个可未被取代或被1至3个选自由以下组成的组的取代基取代:卤素、羟基、氨基、氰基、酰胺基、磺酰胺、硝基、-sh、c
1-c6烷基、c
2-c6烯基、c
3-c7环烷基、c
6-c
10
双环基、c
1-c6卤烷基、c
1-c6全卤烷基、-o-(c
1-c6烷基)、o-(c
3-c7环烷基)、-o-(c
1-c6卤烷基)、-o-(c
1-c6全卤烷基)、芳基、-o-芳基、-(c
1-c6烷基)-芳基、-o-(c
1-c6烷基)-芳基、-s-(c
1-c6烷基)、-s-(c
3-c7环烷基)、-s-(c
1-c6卤烷基)、-s-(c
1-c6全卤烷基)、-s-芳基、-s-(c
1-c6烷基)-芳基、杂芳基和杂环基;
d)式iv:其中:r4选自由以下组成的组:h、c
1-c6烷基、c
2-c6烯基、c
3-c7环烷基、c
6-c
10
双环基、c
9-c
14
三环基、-(c
1-c6烷基)-芳基、-(c
2-c6烯基)-芳基、芳基、杂芳基和杂环基;r5选自由以下组成的组:h、c
1-c6烷基、c
2-c6烯基、c
3-c7环烷基、芳基、杂芳基和杂环基;且其中所述烷基、烯基、环烷基、双环基、三环基、芳基、杂芳基和杂环基中的每一个可未被取代或被1至3个选自由以下组成的组的取代基取代:卤素、羟基、氨基、氰基、酰胺基、磺酰胺、硝基、-sh、c
1-c6烷基、c
2-c6烯基、c
3-c7环烷基、c
6-c
10
双环基、c
1-c6卤烷基、c
1-c6全卤烷基、-o-(c
1-c6烷基)、o-(c
3-c7环烷基)、-o-(c
1-c6卤烷基)、-o-(c
1-c6全卤烷基)、芳基、-o-芳基、-(c
1-c6烷基)-芳基、-o-(c
1-c6烷基)-芳基、-s-(c
1-c6烷基)、-s-(c
3-c7环烷基)、-s-(c
1-c6卤烷基)、-s-(c
1-c6全卤烷基)、-s-芳基、-s-(c
1-c6烷基)-芳基、杂芳基和杂环基;e)式v:其中:r4选自由以下组成的组:h、c
1-c6烷基、c
2-c6烯基、c
3-c7环烷基、c
6-c
10
双环基、c
9-c
14
三环基、-(c
1-c6烷基)-芳基、-(c
2-c6烯基)-芳基、芳基、杂芳基和杂环基;且其中所述烷基、烯基、环烷基、双环基、三环基、芳基、杂芳基和杂环基中的每一个可未被取代或被1至3个选自由以下组成的组的取代基取代:卤素、羟基、氨基、氰基、酰胺基、磺酰胺、硝基、-sh、c
1-c6烷基、c
2-c6烯基、c
3-c7环烷基、c
6-c
10
双环基、c
1-c6卤烷基、c
1-c6全卤烷基、-o-(c
1-c6烷基)、o-(c
3-c7环烷基)、-o-(c
1-c6卤烷基)、-o-(c
1-c6全卤烷基)、芳基、-o-芳基、-(c
1-c6烷基)-芳基、-o-(c
1-c6烷基)-芳基、-s-(c
1-c6烷基)、-s-(c
3-c7环烷基)、-s-(c
1-c6卤烷基)、-s-(c
1-c6全卤烷基)、-s-芳基、-s-(c
1-c6烷基)-芳基、杂芳基和杂环基;f)式vi:
其中:r4选自由以下组成的组:h、c
1-c6烷基、c
2-c6烯基、c
3-c7环烷基、c
6-c
10
双环基、c
9-c
14
三环基、-(c
1-c6烷基)-芳基、-(c
2-c6烯基)-芳基、芳基、杂芳基和杂环基;且其中所述烷基、烯基、环烷基、双环基、三环基、芳基、杂芳基和杂环基中的每一个可未被取代或被1至3个选自由以下组成的组的取代基取代:卤素、羟基、氨基、氰基、酰胺基、磺酰胺、硝基、-sh、c
1-c6烷基、c
2-c6烯基、c
3-c7环烷基、c
6-c
10
双环基、c
1-c6卤烷基、c
1-c6全卤烷基、-o-(c
1-c6烷基)、o-(c
3-c7环烷基)、-o-(c
1-c6卤烷基)、-o-(c
1-c6全卤烷基)、芳基、-o-芳基、-(c
1-c6烷基)-芳基、-o-(c
1-c6烷基)-芳基、-s-(c
1-c6烷基)、-s-(c
3-c7环烷基)、-s-(c
1-c6卤烷基)、-s-(c
1-c6全卤烷基)、-s-芳基、-s-(c
1-c6烷基)-芳基、杂芳基和杂环基;g)式vii其中:每个r7独立地选自卤素、羟基、氨基、氰基、酰胺基、磺酰胺、硝基、-sh、c
1-c6烷基、c
2-c6烯基、c
3-c7环烷基、c
6-c
10
双环基、c
1-c6卤烷基、c
1-c6全卤烷基、-o-(c
1-c6烷基)、o-(c
3-c7环烷基)、-o-(c
1-c6卤烷基)、-o-(c
1-c6全卤烷基)、芳基、-o-芳基、-(c
1-c6烷基)-芳基、-o-(c
1-c6烷基)-芳基、-s-(c
1-c6烷基)、-s-(c
3-c7环烷基)、-s-(c
1-c6卤烷基)、-s-(c
1-c6全卤烷基)、-s-芳基、-s-(c
1-c6烷基)-芳基、杂芳基和杂环基;另外或替代地,两个相邻的r7基团可一起形成稠合的5或6元芳族或非芳族环,其含有0至2个环杂原子并且未被取代或被至多四个选自以下的取代基取代:卤素、羟基、氨基、氰基、酰胺基、磺酰胺、硝基、-sh、c
1-c6烷基、c
2-c6烯基、c
3-c7环烷基、c
6-c
10
双环基、c
1-c6卤烷基、c
1-c6全卤烷基、-o-(c
1-c6烷基)、o-(c
3-c7环烷基)、-o-(c
1-c6卤烷基)、-o-(c
1-c6全卤烷基)、芳基、-o-芳基、-(c
1-c6烷基)-芳基、-o-(c
1-c6烷基)-芳基、-s-(c
1-c6烷基)、-s-(c
3-c7环烷基)、-s-(c
1-c6卤烷基)、-s-(c
1-c6全卤烷基)、-s-芳基、-s-(c
1-c6烷基)-芳基、杂芳基和杂环基;且m是0、1、2、3或4;以及h)式viii
其中:每个r8独立地选自卤素、羟基、氨基、氰基、酰胺基、磺酰胺、硝基、-sh、c
1-c6烷基、c
2-c6烯基、c
3-c7环烷基、c
6-c
10
双环基、c
1-c6卤烷基、c
1-c6全卤烷基、-o-(c
1-c6烷基)、o-(c
3-c7环烷基)、-o-(c
1-c6卤烷基)、-o-(c
1-c6全卤烷基)、芳基、-o-芳基、-(c
1-c6烷基)-芳基、-o-(c
1-c6烷基)-芳基、-s-(c
1-c6烷基)、-s-(c
3-c7环烷基)、-s-(c
1-c6卤烷基)、-s-(c
1-c6全卤烷基)、-s-芳基、-s-(c
1-c6烷基)-芳基、杂芳基和杂环基;另外或替代地,两个相邻的r8基团可一起形成稠合的5或6元芳族或非芳族环,其含有0至2个环杂原子并且未被取代或被至多四个选自以下的取代基取代:卤素、羟基、氨基、氰基、酰胺基、磺酰胺、硝基、-sh、c
1-c6烷基、c
2-c6烯基、c
3-c7环烷基、c
6-c
10
双环基、c
1-c6卤烷基、c
1-c6全卤烷基、-o-(c
1-c6烷基)、o-(c
3-c7环烷基)、-o-(c
1-c6卤烷基)、-o-(c
1-c6全卤烷基)、芳基、-o-芳基、-(c
1-c6烷基)-芳基、-o-(c
1-c6烷基)-芳基、-s-(c
1-c6烷基)、-s-(c
3-c7环烷基)、-s-(c
1-c6卤烷基)、-s-(c
1-c6全卤烷基)、-s-芳基、-s-(c
1-c6烷基)-芳基、杂芳基和杂环基;每个r9独立地选自卤素、羟基、氨基、氰基、酰胺基、磺酰胺、硝基、-sh、c
1-c6烷基、c
2-c6烯基、c
3-c7环烷基、c
6-c
10
双环基、c
1-c6卤烷基、c
1-c6全卤烷基、-o-(c
1-c6烷基)、o-(c
3-c7环烷基)、-o-(c
1-c6卤烷基)、-o-(c
1-c6全卤烷基)、芳基、-o-芳基、-(c
1-c6烷基)-芳基、-o-(c
1-c6烷基)-芳基、-s-(c
1-c6烷基)、-s-(c
3-c7环烷基)、-s-(c
1-c6卤烷基)、-s-(c
1-c6全卤烷基)、-s-芳基、-s-(c
1-c6烷基)-芳基、杂芳基和杂环基;另外或替代地,两个相邻的r9基团可一起形成稠合的5或6元芳族或非芳族环,其含有0至2个环杂原子并且未被取代或被至多四个选自以下的取代基取代:卤素、羟基、氨基、氰基、酰胺基、磺酰胺、硝基、-sh、c
1-c6烷基、c
2-c6烯基、c
3-c7环烷基、c
6-c
10
双环基、c
1-c6卤烷基、c
1-c6全卤烷基、-o-(c
1-c6烷基)、o-(c
3-c7环烷基)、-o-(c
1-c6卤烷基)、-o-(c
1-c6全卤烷基)、芳基、-o-芳基、-(c
1-c6烷基)-芳基、-o-(c
1-c6烷基)-芳基、-s-(c
1-c6烷基)、-s-(c
3-c7环烷基)、-s-(c
1-c6卤烷基)、-s-(c
1-c6全卤烷基)、-s-芳基、-s-(c
1-c6烷基)-芳基、杂芳基和杂环基;x是0、1、2或3;且y是0、1、2、3或4。32.如权利要求1至10中任一项所述的多核苷酸盒或如权利要求11至30中任一项所述的核酸序列,其中所述适体与小分子结合或以其它方式响应所述小分子的存在,所述小分子选自由以下组成的组:醋糠硫胺、乙酰硫胺、蒜硫胺、氨丙啉、氯硫胺、苯磷硫胺、苯甲硫胺、双苯甲硫胺、西托硫胺、赛可硫胺、呋喃硫胺、磷硫胺、奥托硫胺、羟硫胺、丙舒硫胺、舒布
硫胺、硫胺、焦磷酸硫胺和苯酰乙烯硫胺。33.如权利要求32所述的多核苷酸盒或核酸序列,其中所述适体与小分子结合或以其它方式响应所述小分子的存在,所述小分子选自由以下组成的组:苯磷硫胺、呋喃硫胺和丙舒硫胺。34.如权利要求33所述的多核苷酸盒或核酸序列,其中所述适体与苯磷硫胺结合或以其它方式响应苯磷硫胺的存在。35.如权利要求33所述的多核苷酸盒或核酸序列,其中所述适体与呋喃硫胺结合或以其它方式响应呋喃硫胺的存在。36.如权利要求33所述的多核苷酸盒或核酸序列,其中所述适体与丙舒硫胺结合或以其它方式响应丙舒硫胺的存在。37.如权利要求1至10中任一项所述的多核苷酸盒或如权利要求11至30中任一项所述的核酸序列,其中与等摩尔量的呋喃硫胺、苯磷硫胺或丙舒硫胺相比,所述适体具有减少的与焦磷酸硫胺(tpp)的结合和/或显示对焦磷酸硫胺(tpp)的响应降低。38.如权利要求37所述的多核苷酸盒或核酸序列,其中所述适体在作为用于调节靶基因的表达的多核苷酸盒的一部分编码的核糖开关的背景下。39.一种响应小分子而调节靶基因表达的核糖开关,其中所述核糖开关包含如权利要求1至38中任一项所述的适体。40.如权利要求39所述的核糖开关,所述核糖开关包含seq idno:37的序列。41.一种响应小分子而调节靶基因的表达的多核苷酸盒,所述多核苷酸盒包含:(c)核糖开关;和(d)两侧为5'内含子和3'内含子的选择性剪接的外显子,其中所述核糖开关包含(i)包含茎的效应区域,所述茎包括所述3'内含子的5'剪接位点序列,和(ii)如权利要求1至38中任一项所述的适体;且其中所述选择性剪接的外显子包含终止密码子,当所述选择性剪接的外显子被剪接至靶基因mrna中时,所述终止密码子与所述靶基因同框。42.如权利要求[0040]所述的多核苷酸盒,其中所述核糖开关包含seq id no:37的序列。43.如权利要求[0040]所述的多核苷酸盒,其中所述多核苷酸盒位于所述靶基因的蛋白质编码序列中。44.如权利要求[0040]所述的多核苷酸盒,其中所述多核苷酸盒位于所述靶基因的非翻译区或所述靶基因的内含子中。45.一种载体,所述载体包含如权利要求1至10、31至38或41至44中任一项所述的多核苷酸盒、如权利要求11至38中任一项所述的核酸或如权利要求39或40中任一项所述的核糖开关。46.如权利要求45所述的载体,其中所述载体是病毒载体。47.如权利要求46所述的载体,其中所述病毒载体选自由腺病毒载体、腺相关病毒载体和慢病毒载体组成的组。48.一种鉴定响应感兴趣的化合物而调节靶基因表达的适体的方法,所述方法包括以下步骤:
(i)选择亲本适体;(ii)产生包含编码在步骤(i)中选择的所述适体的序列的核糖开关文库,其中所述适体编码序列在所述适体的一个或多个未配对区域中包含一个或多个随机突变的核苷酸,其中所述突变的适体序列在控制报告基因的表达的核糖开关的背景下;(iii)针对与所述亲本适体序列相比,响应根据式i-vii的化合物的添加而增加对所述靶基因表达的调节的适体筛选来自(ii)的所述文库;(iv)任选地重复步骤(ii)和iii(对于步骤(iii)中鉴定的适体)。49.如权利要求48所述的方法,其中所述亲本适体是tpp适体并且所述感兴趣的化合物是硫胺类似物或衍生物。50.如权利要求49所述的方法,其中所述tpp适体选自rfam tpp核糖开关家族rf00059。51.如权利要求49或权利要求50所述的方法,其中所述硫胺类似物或衍生物选自由式i-viii组成的组。52.如权利要求48至51中任一项所述的方法,其中所述适体序列的所述一个或多个未配对区域包含连接区域。53.如权利要求48至51中任一项所述的方法,其中所述未配对区域包含环区域。54.如权利要求48至51中任一项所述的方法,其中所述适体编码序列还包含配对区域中的一个或多个突变核苷酸。55.如权利要求48至51中任一项所述的方法,其中所述适体编码序列还包含与未配对区域相邻的一个或多个突变核苷酸。

技术总结


本公开涉及与包括硫胺类似物和衍生物的某些小分子结合的寡核苷酸适体以及产生与所述小分子结合的适体的方法。还考虑了包含本文公开的适体的核糖开关和多核苷酸盒。还提供了使用所述适体、核糖开关和/或多核苷酸来调节靶基因,包括基因的方法。本文还提供了作为靶基因表达的调节剂的小分子,其中所述靶基因含有包含本文所述的适体的核糖开关。因含有包含本文所述的适体的核糖开关。因含有包含本文所述的适体的核糖开关。


技术研发人员:

郭雪翠 A

受保护的技术使用者:

梅里特斯英国第二有限公司

技术研发日:

2021.03.24

技术公布日:

2023/2/3

本文发布于:2024-09-22 22:31:36,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/66357.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:烷基   序列   核糖   基因
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议