汉字在电脑中是如何存储与编码

汉字在电脑中是如何存储与编码
英语⽂字是拼⾳⽂字,⼀切⽂字均由26个字母拼组⽽成,所以运⽤⼀个字节表明⼀个字符⾜够了。但汉字是象形⽂字,汉字的核算机处置技能⽐英⽂字符杂乱得多,普通⽤两个字节表明⼀个汉字。由于汉字有⼀万多个,常⽤的也有六千多个,所以编码选⽤两字节的低7位
共14个⼆进制位来表明。普通汉字的编码⽅案要处置4种编码问题。
(1)汉字交流码
汉字交流码主要是⽤作汉字信息交流的。以国家标准局1980年公布的《信息交流⽤汉字编码字符集根本集》(代号为GB2312-80)规矩的汉字交流码作为国家标准汉字编码,简称国标码。
国标GB 2312-80规矩,⼀切的世界汉字和符号组成⼀个94×94的矩阵。在该矩阵中,每⼀⾏称为⼀个“区”,每⼀列称为⼀个“位”,这样就构成了94个区号(01~94)和94个位号(01~94)的汉字字符集。国标码中有6763个汉字和628个其他根本图形字符,合计7445个字符。其间规矩⼀级汉字3755个,⼆级汉字3008个,图形符号682个。⼀个汉字地点的区号与位号简略地组合在⼀起就构成了该汉字
http 代理的“区位码”。在汉字区位码中,⾼两位为区号,低两位为位号。因⽽,区位码与汉字或图形符号之间是⼀⼀对应的。⼀个汉字由两个字节代码表明。
(2)汉字机内码核算机博客
汉字机内码⼜称内码或汉字存储码。该编码的作⽤是共同了各种异样的汉字输⼊码在核算机内的表明。汉字机内码是核算机内部存储、处置的代码。核算机既要处置汉字,⼜要处置英⽂,所以必须能差异汉字字符和英⽂字符。英⽂字符的机内码是最⾼位为0的8位ASCII码。为了区别,把国标码每个字节的最⾼位由0改为1,其他位不变的编码作为汉字字符的机内码。
⼀个汉字⽤两个字节的内码表明,核算机显现⼀个汉字的进程⾸先是依据其内码到该汉字字库中的地址,然后将该汉字的点阵字型在屏幕上输出。
汉字的输⼊码是多种多样的,同⼀个汉字若是选⽤的编码⽅案异样,则输⼊码就有能够不相同,但汉字的机内码是相同的。有专⽤的核算机内部存储汉字运⽤的汉字内码,⽤以将输⼊时运⽤的多种汉字输⼊码共同变换成汉字机内码进⾏存储,以便利机内的汉字处置。在汉字输⼊时,依据输⼊码经过核算机或查输⼊码表完结输⼊码到机内码的变换。如汉字世界码(H)+8080(H)=汉字机内码(H)。
(3)汉字输⼊码
汉字输⼊码也叫外码,是为了经过键盘字符把汉字输⼊核算机⽽描绘的⼀种编码。
兵人模型
钝化剂英⽂输⼊时,想输⼊什么字符便按什么键,输⼊码和内码是共同的。⽽汉字输⼊规矩异样,能够要按⼏个键才⼲输⼊⼀个汉字。汉字和键盘字符组合的对应⽅法称为汉字输⼊编码⽅案。汉字外码是对准异样汉字输⼊法⽽⾔的,经过键盘按某种输⼊法进⾏汉字输⼊时,⼈与核算机进⾏信息交流所⽤的编码称为“汉字外码”。关于同⼀汉字⽽⾔,输⼊法异样,其外码也是异样的。例如,关于汉字“啊”,在区位码输⼊法中的外码是1601,在拼⾳输⼊中的外码是a,⽽在五笔字型输⼊法中的外码是KBSK。汉字的输⼊码品种繁复,⼤致有4品种型,即⾳码、形码、数字码和⾳形码。
抗体人源化(4)汉字字形码
汉字在显现和打印输出时,是以汉字字形信息表明的,即以点阵的⽅法构成汉字图形。汉字字形码是指断定⼀个汉字字形点阵的代码(汉字字形码)。普通选⽤点阵字形表明字符。
小品文选刊>微米光
当前遍及运⽤的汉字字型码是⽤点阵⽅法表明的,称为“点阵字模码”。所谓“点阵字模码”,就是将汉字像图画相同置于⽹状⽅格上,每格是存储器中的⼀个位,16×16点阵是在纵向16点、横向16点的⽹状⽅格上写⼀个汉字,有笔画的格对应1,⽆笔画的格对应0。这种⽤点阵⽅式存储的汉字字型信息的调集称为汉字字模库,简称汉字字库。
⼀般汉字显现运⽤16×16点阵,⽽汉字打印可选⽤24×24点阵、32×32点阵、64×64点阵等。汉字字形点阵中的每个点对应⼀个⼆进制位,1字节⼜等于8个⼆进制位,所以16×16点阵字形的字要运⽤32个
字节(16×16÷8字节=32字节)存储,64×64点阵的字形要运
⽤512个字节。
在 16 × 16 点阵字库中的每⼀个汉字以 32 个字节寄存,存储⼀、⼆级汉字及符号共 8836 个,需求 282.5KB 磁盘空间。⽽⽤户的⽂档假定有 10 万个汉字,却只需求 200KB 的磁盘空间,这是由于⽤户⽂档中存储的仅仅每个汉字(符号)在汉字库中的地址(内码)

本文发布于:2024-09-21 15:41:56,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/512540.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:字符   表明   点阵   核算   字节   交流   编码   信息
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议