汉字标准部首笔顺编码及其输入方法

著录项
  • CN98112250.7
  • 19980915
  • CN1208885
  • 19990224
  • 谭吉运
  • 谭吉运
  • G06F3/023
  • G06F3/023

  • 重庆市渝中区中山二路99号华安大厦17楼黄戟
  • 中国,CN,重庆(85)
摘要
本发明选用汉字偏旁部首作汉字拆分的标准部件,采用标准部件笔画的奇偶数分类编码,简单明确,具有汉字的全息功能,能覆盖全部汉字。本编码按笔顺拆分,对数字进行编码组合输入键盘,故名为汉字标准部首笔顺编码及输入方法。$汉字标准部首笔顺编码应用的标准部件,是经常使用和熟悉的汉字偏旁部首,易记、易学、易懂,与汉字教育和书写规范紧密结合。学会本编码,也就掌握了计算机汉字输入方法。本编码是一种快捷的计算机汉字输入系统及词典检索码。
权利要求

1、本发明选用《辞海》的1174个偏旁部首,与两个自定义部件 共同组成176个标准部件。

1.1、将标准部件按笔画数的奇偶,分成奇数笔画和偶数笔画两类。 奇数笔画类按部件的首笔形横(一)含提 、竖(丨)、撇(丿)、 点(丶)含捺()、折 含各种折和钩又各分成五个类,用1、3、 5、7、9顺序对应编码;偶数笔画类以相同方式用2、4、6、8、0顺序对应 编码。奇偶数共10个大笔形类。这种分类方法,具有简单、明确的特点, 同时又能覆盖汉字部件的全部。给与定量之后,就能构成编码的全部数字 结构。因此,采用汉字的偏旁部首,按笔画数进行奇偶分类,同时又按部 件的首笔形按“横、竖、撇、点、折”顺序对奇偶数分类进行再分类,并 用1、3、5、7、9编成奇数笔形的码;用2、4、6、8、0编成偶数笔形的码 ,是本发明的核心之一。此汉字部首分类方法,不但适用于笔顺码,还适 用于形码、音码、形音码。

1.2、每个笔形类,又按有无笔画交叉,分成有交叉笔形类和无交叉 笔形类。有交叉的部件在数字编码下加横,以与无交叉部件进行区别,是 本发明的减少重码而采用的独特方式之一。也是减少重码的重点。

6、按照权利要求1、2、3所述之规则,便捷地对词、词组、词条进 行编码。

6.1、两字词的取码:第一个字取第一码和第二码;第二个字取第二 码和末码,组成该词编码。例:牧马“牧”第一部件是“牛”编码是 “6”,第二部件是“”编码是“6”;“马”第二部件是 编码是 “9”,末部件是“一”编码是“i” ,故“牧马”一词编码为“669i”。

6.2、三字词的取码:第一个字职第一、二码,第二个字取第二码, 第三个字取第一码组成该词编码。例:热电厂,“热”第一部件是“扌” 全交叉编码是“i”,第二部件是“丸”全交叉编码是 ;“电”第二 部件是“”带交叉编码是“9”;“厂”第一部件是“一”代码是“1” ,故“热电厂”一词编码为 。

6.3、四字及以上多字词、词组、词条的编码:第一、三字取第一码 ,第二字及词尾字取第二码,组成编码。例1:全心全意第一、三字均 为“全”,第一部件均为“人”编码均为“6’;第二字“心”第二部件 为“”编码为“9”,第三字取第一码编码为“6”;词尾字“意”第二 部件是“日”编码是“4”,遇“全心全意”一词编码为 。例2: “中华人民共和国”第一字“中”第一部件是“丨”编码为“3”;第二 字“华”第二部件是“丿”带交叉编码为“5”;第三字“人”第一部件 是“丿”编码为“5”;词尾字“国”第二部件是“王”带交叉编码为“2 ” ,故“中华人民共和国”词条的编码为“3552”。

2、为更好地减少重码,特设置特种部件,其原则和方法为:

2.1、对字的角包围和三面包围部件为特种部件。

2.2、所有部件中笔画全交叉的部件为特种部件。

2.3、除左右结构汉字外,其余结构汉字按笔顺拆分之末码部件为特 种部件。

2.4、特别规定口、勹(ク)、讠、亠、钅、亻、氵、八种为特种部件。

3、本编码的分类方法、原则也适用于繁体字。

以上四大类部件。作为特种部件,在其编码数字头上加点表示。特种 部件中的交叉部件,只加点,不加横。

4、本发明笔顺拆分编码原则与汉字书写规范一致,即先横后竖、先 撇后捺、从上至下、从左到右、从外向内、先里头后封口、先中间后两边 。按此原则进行汉字拆分编码,是本发明的特点。此种编码,笔顺要求严 格,与书写规范紧密结合。能正确编码,就能正确掌握汉字的书写规范; 反之亦然,只有正确掌握汉字的书写规范,才能正确编码,故能与中小学 语文教育相结合。

5、本发明在使用标准部件对汉字进行拆分时,较为灵活,而不是死 搬硬套。在左右结构和上下结构汉字的拆分时,若只有两个标准部件的汉 字,则按笔顺第一个部件直接编码,第二个部件按规则再次进行完全拆分 ,得到新的编码,这种灵活的减少重码的方法,是本发明的特点之一。

7、本编码作为计算机汉字输入法,有二种输入方式:

7.1、使用标准键盘输入。采用主键盘区数字键输入1、2、3、4、5、 6、7、8、9、0码;用字母键A、B、C、D、E、F、G、H、I、J对应输入交 叉部件代码1、2、3、4、5、6、7、8、9、0;用字母键K、L、M、N、O、P 、Q、R、S、T对应输入特种部件代码

7.2、使用标准键盘输入。用小键盘区数字键输入,用“一”键作交 叉部件功能键,用“+”键作特种部件功能键输入编码。

8、本发明编码具有简单、逻辑性强的特点,重码率低、字与码对应 性强。且严格按照汉字的结构特点和书写规范进行编码,故适用于各种汉 字排序检索、中小学语文教育和计算机汉字输入。

9、保留本发明基本原理,使用在著作、研究、汉字词典检索、教学 (音像制品)及计算机光盘制作的权利。

说明书

汉字标准部首笔顺编码及其输入方法

本发明选用《辞海》1989年版部首笔画笔形索引之部份部首及两个自定义部件作为 标准部件。其基本特点是严格按照汉字书写之笔顺规范。汉字的拆分,只要具备与标准 部件笔画数相等、书写时笔顺相同笔形相近,就可进行拆分。按拆分部件编码进行数字 组合的编码,称之为汉字标准部首笔顺编码。

本笔顺码,要求对汉字的书写规范具有严格、清晰的概念。且学习汉字的书写规范 与学习本编码可同步进行。故本发明具有将识字教育、汉字书写、排序检索及计算机汉 字输入相结合为一体的特点。本发明,属语文教育与计算机汉字输入领域。

我国要在中小学普及计算机教育,汉字编码是关键问题之一。目前已有的编码不少, 且使用最多的是音码和形码。音码虽然与中小学语文教学相结合,但重码率高、输入速 度慢,并有不会读音就无法输入的不足。形码反映了汉字的特征,但其选用和规定的基 本部件太多,记忆量大,只适应专业人员使用,且其拆分规则往往破坏了汉字的基本结 构原则和成字规范,不能与中小学语文教育相结合。

本发明编码覆盖汉字范围,以国家现行文字标准为准。同时根据国家汉字标准化原 则的要求,暂不考虑繁体字的拆分编码。对于繁体字的实际需要,可直接使用应用软件 在打印时转化解决。

本发明的目的,是为用户提供一个易记、易学、易懂、重码率低、符合汉字自身规 律,既可供专业人员使用,又能与中小学语文教育相结合的,方便排序检索的编码和快 捷的计算机汉字输入方法。 一、部件及分类

1、部件

(1)、标准部件是由《辞海》中选取174个部首和二个自定义部件( )组成,总 计176个标推部件。这些标准部件能够比较全面、完整反映汉字的内函及特点,对汉字 具有全息性。

(2)、特种部件

为了碱少重码,作者提出以下四种特种部件概念。

(2)-1、笔画全交叉有;扌、十、女等;

(2)-2、凡汉字的角包围(如:旬、远)及三面包围(如:匡)的部件。

(2)-3、除左右结构的汉字外,其它结构汉字的末部件(如:“我”字的末部件为点 (丶)。

(2)-4、规定:口、勹(ク)、讠、亻、钅、氵七类为特种部件。

2、分类

(1)、标准部件是按标准部件的始笔笔形分为横(一)含 ;竖(丨);撇(丿);点 (丶)含捺();折 (含各种折和钩)。

(2)、按标准部件笔画的奇偶数分为奇数笔画和偶数笔画两大类。 奇数笔面始笔形对应编码为:

横(提)   竖   撇  点(捺)  折(钩)

   1   3   5    7    9

横(提)   竖   撇  点(捺)  折(钩)     2     4     6     8     0

(3)、按笔画是否交叉,分为有交叉笔画部件和无交叉笔画部件。有交叉笔画地在编 码下加“一”如(1、3、5、7、9、2、4、6、8、0)。无交叉笔画编码不变。 (4)、特种部件在编码上加“丶”,如 特种部件 中的交叉部件,其编码只加“丶”,不加“-”。

3、其它

(1)、调整部件及编码

部件“艹、廾”按前面所述规定,其编码应为 ,但为了减少重码,特规定,该 部件编码调整为

(2)、自定义部件及编码 根据本发明编码的具体情况,在不违背汉字结构和书写规律原则前提下,特自定义 为汉字部件, 称为竖字头; 称为足字底。在附表中,按笔 顺原则归为“4”码。

所有部件及其分类详见附表一(奇数部件表)、附表二(偶数部件表)。 二、拆分原则

1、按笔顺进行拆分部件及组合编码,其规则为:

(1)-1、按汉字的标准书写规范:先横后竖、先撇后捺、从上至下、从左到右、从 外向内、先里头后封口、先中间后两边,进行拆分。

(1)-2、除纯粹的横笔部件外,笔画相交的地方不能拆分为多笔部件,只能拆分为 单笔部件。

2、汉字编码以四码为限。

(2)-1、汉字拆分部件超过4个,则按笔顺顺序取前三个部件和最后一个部件编成四 码。

(2)-2、拆分部件少于4个,则按笔顺顺序直接按部件编码。

(2)-3、左右结构和上下结构汉字,拆分部件为2个的,按笔顺,第一个部件不拆分 直接编码。第二个部件拆分成笔画更少的部件,且尽可能完全拆分成两个多笔部件进行 编码;两个多笔部件不能合符规则进行完全拆分的,才拆分成三个部件进行编码。

(2)-4、左右结构和上下结构汉字,拆分部件为2个的,第二个部件的再拆分遵从按 笔顺多笔画优先编码原则。该原则也适用于独体字。

(2)-5、单笔画独体汉字只编成一码。

(2)-6、在不能构成多笔部件时,连续横笔有几笔算几码,如“丰”字连续三个横 笔带交叉编码为“3”,“拜”字右部 连续四个横笔带交叉,编码为“4”。 三、范例 四、附表说明

4.1、附表一包含成字和不成字奇数部件及单笔部件。

4.2、附表二包含成字和不成字偶数部件。

4.3、除按规定之末部件外,其它特种部件在附表中以在部件上加点表示。

本文发布于:2024-09-25 18:22:16,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/73272.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议