关于DNA编码的一些研究

遗传密码决定蛋白质中氨基酸顺序的核苷酸顺序 ,由3个连续的核苷酸组成的密码子所构成 。由于脱氧核糖核酸(DNA)双链中一般只有一条单链(称为有义链或编码链)被转录为信使核糖核酸(mRNA),而另一条单链(称为反义链)则不被转录,所以即使对于以双链 DNA作为遗传物质的生物来讲,密码也用核糖核酸(RNA)中的核苷酸顺序而不用DNA中的脱氧核苷酸顺序表示。
遗传密码是一组规则,将DNA或RNA序列以三个核苷酸为一组的密码子转译为蛋白质的氨基酸序列,以用于蛋白质合成。几乎所有的生物都使用同样的遗传密码,称为标准遗传密码;即使是非细胞结构的病毒,它们也是使用标准遗传密码。
原子吸收法现在所遇到的问题就是:如何将交叉编码后的碱基序列中不包含终止密码子和开始密码子(TAG,TGA,TAA)
该问题也就是说:必须有一种特定编码方式使得交叉编码后的碱基序列不包含终止密码子,反响推导可以知道,存在一些特定的情况不能用于交叉编码中。
以下就是推导论证方法:
TAA
TAG
TGA
ATG
000
ATT
ATC
ACT
TAC
001
ATA
ATG
ACA
TAG
010
AAT
AAC
AGT
TTC
011
AAA
AAG
AGA
TTG
100
TTT
TTC
TCT
AAC
101
TTA
TTG
TCA
AAG
110
TAT
TAC
TGT
ATC
111
TAA
TAG
TGA
ATG
也就是说这些是不能用于进行随机交叉编码的密码子,除去重复的共有24种不可用的碱基密码子:ACT ACA AGT AGA TCT TCA TGT TGA  ATT ATA AAT AAA TTT TTA TAT TAA  ATC ATG AAC AAG TTC TTG TAC TAG也就是说这24中编码不能用于DNA编码中。
现在又可以知道的是三位一个密码子共有4*4*4=64中编码方式,意味着有40种编码方式可以使用(ACC ACG AGC AGG TCC TCG TGC TGG CAA CAT CAC CAG CTA CTT CTC CTG CCA CCT CCC CCG CGA CGT CGC CGG GAA GAT GAC GAG GTA GTT GTC GTG GCA GCT GCC GCG GGA GGT GGC GGG),40>>26(英文字母表的字符个数),所以从理论来讲使用一个密码子编码一个英文字符是可行的。
优点:
相对于一般的将明文信息转换为二进制数据再进行数字编码的编码方式而言,该编码方式可以节省一位的空间,尤其是在加密信息巨大的情况下,每一位的存储空间都很珍贵。
    更加简单,省去了很多的繁琐的处理,只需要对照编码即可。
缺点:
随机交叉编码的必要性:
    如果将编码后的明文信息直接藏在一段序列中,入侵者可以很容易破解出明文。
    例如:假如ACC编码字符A,ACG编码字符B,AB的碱基编码就是ACCACG,现在直接将编码后的DNA序列藏于一段DNA序列的ORF: ATGTGGTGGTCCTAG中,ATGTGGTACCACGGGTCCTAG。在这种情况下,可以使用不同的阅读方式来破解:
ATG TGG TAC CAC GGG TCC TAG这种情况下得到错误的信息。
A TGT GGT ACC ACG GGT CCT AG这种情况下就可以得到AB。
所以由上例可以看出,在进行DNA序列拼接之前还需要进一步的处理
对于上例来说:
ACCACG在一段指导编码011010的指导作用下进行交叉编码为TCCTCC,再将其编码到ORF中:ATGTGGTGTCCTCCGTCCTAG
对其进行不同的阅读方式进行破解:
A TGT GGT GTC CTC CGT CCT AG
ATG TGG TGT CCT CCG TCC TAG
AT GTG GTG TCC TCC GTC CTAG
可以看到虽然第三种阅读方式是正确的,但是在不知道明确信息的前提下,入侵者是不能区别的。
就算入侵者能区别,他仍需要对该信息进行穷举攻破,当数据位数较小时,该工作很容易破解,但是当数据位数较大时,破解工作就显得天方夜谭。也就是说需要4n中情况。
进一步的研究:
    ORF是指导蛋白质的一段可以编码基因片段,该编码非彼编码,这里的编码指导多肽的编码,而上文的编码指的是对字符的编码。
我们知道氨基酸有一个编码表:
   
-
-
第二位碱基
第二位碱基
第二位碱基
第二位碱基
-
-
T
C
A
G




T
四氯化碳萃取碘
TTT (Phe/F)苯丙氨酸
TTC (Phe/F)苯丙氨酸
TTA (LeT/L)亮氨酸
TTG (LeT/L)亮氨酸
TCT (Ser/S)丝氨酸
TCC (Ser/S)丝氨酸
TCA (Ser/S)丝氨酸
TCG (Ser/S)丝氨酸
TAT (Tyr/Y)酪氨酸
TAC (Tyr/Y)酪氨酸
TAA (终止)
TAG (终止)
TGT (Cys/C)半胱氨酸
TGC (Cys/C)半胱氨酸
TGA (终止)
TGG (Trp/W)氨酸




C
CTT (LeT/L)亮氨酸
CTC (LeT/L)亮氨酸
CTA (LeT/L)亮氨酸
CTG (LeT/L)亮氨酸
CCT (Pro/P)脯氨酸
CCC (Pro/P)脯氨酸
CCA (Pro/P)脯氨酸
CCG (Pro/P)脯氨酸
CAT (His/H)组氨酸
CAC (His/H)组氨酸
CAA (Gln/Q)谷氨酰胺
CAG (Gln/Q)谷氨酰胺
CGT (Arg/R)精氨酸
CGC (Arg/R)精氨酸
CGA (Arg/R)精氨酸
CGG (Arg/R)精氨酸




A
ATT (Ile/I)异亮氨酸
ATC (Ile/I)异亮氨酸
ATA (Ile/I)异亮氨酸
ATG (Met/M)甲硫氨酸(起始)
ACT (Thr/T)苏氨酸
ACC (Thr/T)苏氨酸
ACA (Thr/T)苏氨酸
ACG (Thr/T)苏氨酸
AAT (Asn/N)天冬酰胺
AAC (Asn/N)天冬酰胺
AAA (Lys/K)赖氨酸
AAG (Lys/K)赖氨酸
AGT (Ser/S)丝氨酸
AGC (Ser/S)丝氨酸
AGA (Arg/R)精氨酸
AGG (Arg/R)精氨酸




G
GTT (Val/V)缬氨酸
GTC (Val/V)缬氨酸
GTA (Val/V)缬氨酸
GTG (Val/V)缬氨酸
GCT (Ala/A)丙氨酸
GCC (Ala/A)丙氨酸
GCA (Ala/A)丙氨酸
GCG (Ala/A)丙氨酸
GAT (Asp/D)天冬氨酸
GAC (Asp/D)天冬氨酸
GAA (GlT/E)谷氨酸
GAG (GlT/E)谷氨酸
GGT (Gly/G)甘氨酸
GGC (Gly/G)甘氨酸
GGA (Gly/G)甘氨酸
GGG (Gly/G)甘氨酸
注:(起始)标准起始编码,同时为甲硫氨酸编码。mRNA中第一个ATG就是蛋白质翻译的起始部位。
逆密码子表
  此表列出了和20种氨基酸和密码子的标准配对。
 
永远的谭嗣同室外给排水
Ala
A
GCT,GCC,GCA,GCG
LeT
L
TTA,TTG,CTT,CTC,CTA,CTG
Arg
R
CGT,CGC,CGA,CGG,AGA,AGG
Lys
K
AAA,AAG
Asn
N
AAT,AAC
Met
M
ATG
Asp
D
GAT,GAC
Phe
F
TTT,TTC
Cys
C
TGT,TGC
Pro
P
CCT,CCC,CCA,CCG
Gln
Q
CAA,CAG
Ser
S
TCT,TCC,TCA,TCG,AGT,AGC
GlT
E
GAA,GAG
Thr
T
ACT,ACC,ACA,ACG
Gly
G
GGT,GGC,GGA,GGG
Trp
W
TGG
His
H
CAT,CAC
Tyr
Y
TAT,TAC
Ile丙烯酸酯
I
ATT,ATC,ATA
Val
V
GTT,GTC,GTA,GTG
起始
ATG
终止
TAG,TGA,TAA
如何详细具体的编码英文字符,其编码方式应该符合这样的条件:1.不能使24中的编码方式;2.必须能够编码一个特定的氨基酸。
集合A:24中可能产生终止密码子的编码方式
集合B:可用的40中编码方式
集合C:可以编码氨基酸的编码方式
可以用来进行编码字符的集合target=BC
预期:|target|26
可用来进行编码的target集合:
{GCT,GCC,GCA,GCG,CGT,CGC,CGG,AGG,GAC,GAT,TGC,CAA,CAG,GAA,GAG,GGT,GGC,GGA,GGGCAT,CAC,CTT,CTC,CTA,CTG,CCT,CCC,CCA,CCG,TCC,TCG,AGC,ACC,ACG,TGG,GTT,GTC,GTA,GTG}
证明:target=B
Ala
A
GCT,GCC,GCA,GCG
LeT
L
TTA,TTG,CTT,CTC,CTA,CTG
Arg
R
CGT,CGC,CGA,CGG,AGA,AGG
Lys
K
AAA,AAG
Asn
N
AAT,AAC
Met
M
ATG
Asp
D
GAT,GAC
Phe
F特鲁多
TTT,TTC
Cys
C
TGT,TGC
Pro
P
CCT,CCC,CCA,CCG
Gln
Q
CAA,CAG
Ser
S
TCT,TCC,TCA,TCG,AGT,AGC
GlT
E
GAA,GAG
Thr
T
ACT,ACC,ACA,ACG
Gly
G
GGT,GGC,GGA,GGG
Trp
W
TGG
His
H
CAT,CAC
Tyr
Y
TAT,TAC
Ile
I
ATT,ATC,ATA
Val
V
GTT,GTC,GTA,GTG
起始
ATG
终止
TAG,TGA,TAA
其中红着的是不能用来进行编码的24种方式。

本文发布于:2024-09-22 07:37:02,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/199174.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:编码   密码子   进行
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议