信息交换用汉字编码字符集

《信息交换用汉字编码字符集--基本集》—即国家标准 GB2312-80
从1975年开始,我国为了研究汉字的使用频度,进行了大规模的字频统计工作,内容包括工业、农业、军事、科技、政治、经济、文学、艺术、教育、体育、医药卫生、天文地理、自然、化学、文字改革、考古等多方面的出版物,在数以亿计的浩瀚文献资料中,统计出实际使用的不同的汉字数为6335个,而其中有3000多个汉字的累计使用频度达到了99.9%,而另外的3000多个累计频度不到0.1%,说明了常用汉字与次常用汉字的数量不足7000个,这就为国家制定汉字库标准提供了依据。
1980年颁布了《信息交换用汉字编码字符集—基本集》的国标交换码,国家标准号为:GB2312-80,选入了6763个汉字,分为两级,一级字库中有3755个,是常用汉字,二级字库中有3008个,是次常用汉字;还选入了682个字符,包含有数字、一般符号、拉丁字母、日本假名、希腊字母、俄文字母、拼音符号、注音字母等。以前我国大陆的各种中文DOS版本、Windows3.1 /3.2版本,装入的字库都是国标一二级字库。
st托普
《GB2312-80》对 7445 个图形字符作了二进制数编码,这些图形字符是:
6763 个汉字,字体为简化字,分成两级。第一级汉字 3755 个,按拼音排序,约占近代文献汉字累计使用频度 99.9% 左右;二级汉字 3008 个,按部首、笔画排序。一、二级汉字约占累计使用频度 99.99% 以上。
202 个一般符号。其中包括 1.~20.,(1)~(20),①~⑩,(-)~(+) 等。
22 个数字。其中 0~9 共 10 个,Ⅰ~Ⅻ 共 12 个。
52 个拉丁字母。其中大写字母 A~Z碳酸铵 26 个,小写字母 a~z 26 个。
169 个日文假名。其中平假名 83 个,片假名 86 个。
48 个希腊字母。其中大写字母 Α~Ω24 个,小写字母 α~ω 24 个。
66 个俄文字母。其中大写字母 А~Я33 个,小写字母 а~я 33 个。
26 个汉语拼音符号,包括带声调符号和其它符号的字母。
37 个汉语注音字母,ㄅ~ㄥ。
GB2312简体中文编码表
code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
A1A0      、 。 · ˉ ˇ ¨ 〃 々 — ~ ‖ … ‘ ’
A1B0  “ ” 〔 〕 〈 〉 《 》 「 」 『 』 〖 〗 【 】
A1C0  ± × ÷ ∶ ∧ ∨ ∑ ∏ ∪ ∩ ∈ ∷ √ ⊥ ∥ ∠
A1D0  ⌒ ⊙ ∫ ∮ ≡ ≌ ≈ ∽ ∝ ≠ ≮ ≯ ≤ ≥ ∞ ∵
A1E0  ∴ ♂ ♀ ° ′ ″ ℃ $ ¤ ¢ £ ‰ § № ☆ ★
A1F0  ○ ● ◎ ◇ ◆ □ ■ △ ▲ ※ → ← ↑ ↓ 〓 
code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
火龙疗法A2A0    ⅰ ⅱ ⅲ ⅳ ⅴ ⅵ ⅶ ⅷ ⅸ ⅹ         
A2B0    ⒈ ⒉ ⒊ ⒋ ⒌ ⒍ ⒎ ⒏ ⒐ ⒑ ⒒ ⒓ ⒔ ⒕ ⒖
A2C0  ⒗ ⒘ ⒙ ⒚ ⒛ ⑴ ⑵ ⑶ ⑷ ⑸ ⑹ ⑺ ⑻ ⑼ ⑽ ⑾
A2D0  ⑿ ⒀ ⒁ ⒂ ⒃ ⒄ ⒅ ⒆ ⒇ ① ② ③ ④ ⑤ ⑥ ⑦
A2E0  ⑧ ⑨ ⑩    ㈠ ㈡ ㈢ ㈣ ㈤ ㈥ ㈦ ㈧ ㈨ ㈩ 
A2F0    Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ Ⅵ Ⅶ Ⅷ Ⅸ Ⅹ Ⅺ Ⅻ     
code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
A3A0    ! " # ¥ % & ' ( ) * + , - . /
A3B0  0 1 2 3 4 5 6 7 8 9 : ; < = > ?
A3C0  @ A B C D E F G H I J K L M N O
A3D0  P Q R S T U V W X Y Z [ \ ] ^ _
A3E0  ` a b c d e f g h i j k l m n o
A3F0  p q r s t u v w x y z { | }  ̄ 
code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
A4A0    ぁ あ ぃ い ぅ う ぇ え ぉ お か が き ぎ く
A4B0  ぐ け げ こ ご さ ざ し じ す ず せ ぜ そ ぞ た
A4C0  だ ち ぢ っ つ づ て で と ど な に ぬ ね の は
A4D0  ば ぱ ひ び ぴ ふ ぶ ぷ へ べ ぺ ほ ぼ ぽ ま み
A4E0  む め も ゃ や ゅ ゆ ょ よ ら り る れ ろ ゎ わ
A4F0  ゐ ゑ を ん                       
code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
A5A0    ァ ア ィ イ ゥ ウ ェ エ ォ オ カ ガ キ ギ ク
A5B0  グ ケ ゲ コ ゴ サ ザ シ ジ ス ズ セ ゼ ソ ゾ タ
A5C0  ダ チ ヂ ッ ツ ヅ テ デ ト ド ナ ニ ヌ ネ ノ ハ
A5D0  バ パ ヒ ビ ピ フ ブ プ ヘ ベ ペ ホ ボ ポ マ ミ
A5E0  ム メ モ ャ ヤ ュ ユ ョ ヨ ラ リ ル レ ロ ヮ ワ
A5F0  ヰ ヱ ヲ ン ヴ ヵ ヶ                 
code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
A6A0    Α Β Γ Δ Ε Ζ Η Θ Ι Κ Λ Μ Ν Ξ Ο
A6B0  Π Ρ Σ Τ Υ Φ Χ Ψ Ω             
雷尼镍A6C0    α β γ δ ε ζ η θ ι κ λ μ ν ξ ο
A6D0  π ρ σ τ υ φ χ ψ ω             
A6E0  ︵ ︶ ︹ ︺ ︿ ﹀ ︽ ︾ ﹁ ﹂ ﹃ ﹄    ︻ ︼
A6F0  ︷ ︸ ︱  ︳ ︴                   
code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
A7A0    А Б В Г Д Е Ё Ж З И Й К Л М Н
A7B0  О П Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э
A7C0  Ю Я                           
A7D0    а б в г д е ё ж з и й к л м н
A7E0  о п р с т у ф х ц ч ш щ ъ ы ь э
A7F0  ю я                           
code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
A8A0    ā á ǎ à ē é ě è ī í ǐ ì ō ó ǒ伍止渊
A8B0  ò ū ú ǔ ù ǖ ǘ ǚ ǜ ü ê ɑ  ń ň 
A8C0  ɡ        ㄅ ㄆ ㄇ ㄈ ㄉ ㄊ ㄋ ㄌ ㄍ ㄎ ㄏ
A8D0  ㄐ ㄑ ㄒ ㄓ ㄔ ㄕ ㄖ ㄗ ㄘ ㄙ ㄚ ㄛ ㄜ ㄝ ㄞ ㄟ
A8E0  ㄠ ㄡ ㄢ ㄣ ㄤ ㄥ ㄦ ㄧ ㄨ ㄩ           
A8F0                                 
code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
A9A0          ─ ━ │ ┃ ┄ ┅ ┆ ┇ ┈ ┉ ┊ ┋
A9B0  ┌ ┍ ┎ ┏ ┐ ┑ ┒ ┓ └ ┕ ┖ ┗ ┘ ┙ ┚ ┛
A9C0  ├ ┝ ┞ ┟ ┠ ┡ ┢ ┣ ┤ ┥ ┦ ┧ ┨ ┩ ┪ ┫
A9D0  ┬ ┭ ┮ ┯ ┰ ┱ ┲ ┳ ┴ ┵ ┶ ┷ ┸ ┹ ┺ ┻
A9E0  ┼ ┽ ┾ ┿ ╀ ╁ ╂ ╃ ╄ ╅ ╆ ╇ ╈ ╉ ╊ ╋
肖尔铁茨
A9F0                       
code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F

本文发布于:2024-09-22 17:28:00,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/536638.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:符号   使用   频度   包括
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议