大字符集十全简笔汉字输入法及其键盘

著录项
  • CN96118277.6
  • 19960729
  • CN1172297
  • 19980204
  • 谢克中
  • 谢列妮;谢克中
  • G06F3/023
  • G06F3/023

  • 湖南省长沙市中南工业大学胜利村27栋602号
  • 中国,CN,湖南(43)
摘要
本发明涉及一种计算机汉字形码输入法及其键盘。本发明由六种基本笔画和四种复笔画作为十个基本码元按规范笔顺为一切汉字编码,这是“大字符集谢氏简笔汉字输入法及其键盘”(专利申请号:95112526.5)的改进和发展:除增加了两个基本码元外,对字元简化和键盘设计及词的简码设计作了大的改进,使得在保持前一发明的易学、高效等优点的同时,大大降低了汉字输入的重码率。
权利要求

1、一种大字符集十全简笔汉字输入法,其特征在于除把基本笔 画分成六类之外,再用四种汉字复笔画共构成十类基本汉字字形,作 为汉字编码的十个基本码元。

这十类基本字形如表一的第二列与第三列所示。

表一

其中六类基本笔画与“大字符集谢氏简笔汉字输入法及其键盘”专 利(申请号95112526.5)完全一致,今后凡提到“上一专利”均指上述 申请号为95112526.5的专利。

本专利的新特征在四类复笔画,其中二个是上一专利的改进,另 二个是扩充。四种复笔画是依国家规范笔顺接踵写出的三至四个基本 笔画所构成的字元。

说明书

大字符集十全简笔汉字输入法及其键盘

本发明涉及一种用于电脑汉字输入的汉字编码方法及其输入键盘。 本发明是同一组发明人的前一发明专利“大字符集谢氏简笔汉字输入法 及其键盘”(申请号95112526.5)的改进和发展。本发明在保持前一专 利的简单易学、高编码效率之外,大大降低了编码输入方案的重码率。 采用本发明,一般用户在输入汉字时基本上已不再需要进行劳神、费 时的重码选择操作。

和前一发明专利(申请号95112526.5)相比,本项专利在原来的 八个基本码元之外又扩充了两个基本码元,构成十基本码元方案,同 时对字元简化规则进行了改进,发明了新的输入键盘,提出了新的词 缩略码设计方法。

大字符集十全简笔汉字输入法(以下常简称十全码)的十基本码元

十全码用六种基本笔画和四种复笔画,合成十个基本码元直接为 大字符集20,902个汉字编码,十个基本码元及其所代表的基本笔画 和复笔画如表一:

表一  十全简笔输入法的十个基本码元及其所代表的基本笔画与复笔画

所谓基本笔画是指正规书写时在下笔与提笔之间一笔写成的连续 笔画,组成汉字的基本笔画约三十多个。复笔画是由1至多个基本笔画 构成的简单字元。

在十全简笔输入法中,六类基本笔画与上述前一专利(申请号95112526 ·5)完全一致,四种复笔画则作了改进和扩充。其中复笔画 叫作叉, 共代表五个复笔画(见表一),即先横后竖的 、 、先横后撇的 以 及先撇后点(捺)的 和乂。简笔输入法严格遵循国家规范笔顺,基本 码元 代表的上述五种复笔画都有确定的笔顺。因此,按先竖后横写 出的 、 和先撇后横写出的 就不认为是基本码元叉。

基本码元 代表十二个复笔画,它们分别依次出现在以下十二种 汉字中:贝、领( )、全(木)、兵、分、籴、飞、衣、羊、火、为、 州。 类复笔画共有三种情形,即(i)先撇后点(捺),撇在左边,如 ;(ii)先撇后点(捺),撇在上面,(捺)在下面,如 等; (iii)先点后撇,点在左边,撇在右边,如丷 等。基本码元 就 代表上述三种类型的十二个复笔画。刃字的最后两个笔画也是由点和 撇构成的,在十全简笔方案中,它不被看作属于基本码元 所代表的 同一类复笔画,因为在书写刃字时,虽然是先写撇,后写点,但后写 地点不在撇的右边,而在其左边。

基本码元口就代表自己。基本码元日代表二个,它自已和卧倒的 日即 。 仅出现在临这一个字当中。

作为十类笔画(含基本笔画和复笔画)的代表的十个基本码元分别 叫作横、竖、撇、点、右折、左折、叉、人、口、日。

十全简笔输入法就是用上述十个基本(字形)码元直接为所有汉字 编码。换言之,在十全简笔输入法中,每个汉字的输入码就是由上述 十个基本码元构成的有限串,而不是像其他形码那样,由西文字符的 有限串表示汉字的输入码。因此,十全简笔码像我们的上一专利一样, 是地地道道的汉字形码。

十全简笔输入法的编码规则如下

(1)按国家规范笔顺从待编汉字中取出前三个基本码元和最后两 个基本码元构成该字的输入码。不足五个基本码元的汉字取完所有码 为止。因此汉字的十全简笔码的码长最长是5。汉字十全简笔输入码中 的每一个码都是表一的十个基本码元中的一个。

为叙述方便起见,在简笔输入法的述语中,我们总是把复笔画也 看作是一个笔画,即每次说到“一个笔画”,它可能是指一个基本笔画, 也可能是指一个复笔画。

(2)对部分字元(偏旁部首),规定只取其中一个或二个笔画(基本 笔画或复笔画),而省略其他笔画,这部分字元特称十全方案的简化字 元。

十全简笔输入法的简化字元及其简化规则如表二,它与我们的上 一专利有很多不同。

          表二  十全简笔输入法的简化字元

                 以下字元仅取其一笔

                 以下字元取头二个笔画

                 以下字元取首末两笔

                 以下字元取其中特征性的两笔

(3)当两个简化字元相接而共有一些笔画或复笔画时,依笔顺优 先原则把头一个简化字元进行简化。任何笔画只参与一次简化。

三、十全简码方案直接用十种汉字笔画(六种基本笔画加四种复笔 画)作为十个基本码元为一切汉字编码。这一点与我们的前一发明专利 一样,但上一专利只用八个基本码元,本专利则增加了两个,目的是 进一步减少重码机会。由于直接用十种基本汉字字形为汉字编码,省 去了用西文字符为汉字编码的中间环节。

下面是一些汉字的十全简笔码实例

十全简笔汉字输入方案的码表是像上表那样的字形码表,而不像 其他字元形码方案那样是一些西文字符码表。

十全简笔输入方案的字符码

为了利用通用键盘输入汉字,需要把汉字输入码映射为键位字符 码。简笔方案的十个基本字形码的西文(键位)字符码的二个稍稍不同 的方案如表一的字符码1和字符码2所示。字符码1的十个字形基本码 的字符码,都属于中排基本键,其中最后一个代码是;号。字符码2的 最后一个字符是P,位于上排,即十个字符码清一为十个西文字母。 二个字符码方案的绝大多数字符都位于中排基本键,因此用简笔法输 入汉字时,双手手指的击键动作范围极小,因而击键频率会较高。

十个基本字形码-、丨、丿、、 、 、 、 、口、日在十 全简笔输入方案的术语中特称主输入码、主字形码、主外部码或简称 主码,其对应的西文字符码j、f、k、d、h、g、l、s、p(;)、a等特 称主字符码、主内码,有时也笼统地简称主码。简笔输入方案的基本 码均由主码(主外码或主内码)表示:面对终端用户用主输入(字形)码 表示,面对机器和软件开发人员则用主字符码即主内码表示。本方案 用户手册提供的码表就是汉字的主输入码码表即字形码表,不提供内 码码表,简笔方案根本不要求用户记住汉字的西文字符码。

十全简笔输入方案的指位码

简笔输入方案中,十个基本字形码的西文字符代码实际上只作为 软件内部码使用,终端用户不必记忆十个基本字形码元与其西文字符 码之间的对应关系,而只需记住十基本码元与操作员自己双手十个指 位之间的对应关系即可。十字形码与十指位之间的对应关系见表一。 在简笔输入法的技术术语中,我们把十个字形基本码元与操作员双手 十指位之间的固定的永久的一一对应关系叫作基本字形的指位码。简 笔输入方案要求用户熟记的是指位码,而完全不必去记忆它们的字符 码—这是软件人员才需要关心的事。当操作员用标准指法上机输入时, 十个基本字形码与十个键位字符间的对应关系就通过双手的标准指位 自然地机械地实现。也就是说,操作员按标准指法击键时,他(她)们 完全不需要去记汉字字形的西文字符代码。下一节将会看到,记西文 代码不但没什么帮助,反而会增加麻烦。

十全简笔方案的同义码

简笔输入法把指位码概念看成方案的基础性概念,并加以引伸。

在简笔输入法中,操作员依国际标准指法在标准西文键盘的四排 10列字符键的上、下(Shift)档共八十个键位的一次击键都可以表示 向联机的电脑输入了相应指位码的一个基本字形(一个基本笔画或一个 复笔画)。

按上述概念,例如,不仅右食指(本位)在中排所击的基本键(即j 键)可以表示向电脑输入了一个笔画横,它击上排(u键)、下排(m键)、 顶排(7键)都是向电脑输入了笔画横;右食指本位所击的下档四键即&、 U、J、M也都是。这就是说,十个基本字形码元的每一个均可以由它 们各自固有的指位用八种方式输入电脑。但是,我们把从中排基本键 上档j、f、k、d、h、g、l、s、a、p(字符码2)或;(字符码1)等十个 键位输入的字形码叫作主码,其他的都叫作同义码。这样,每一个主 码有7个同义码。相对于主码的位置,把它们分别叫作下档同义码,上 排上(下)档同义码,顶排(上上排)上(下)档同义码,下排上(下)档同 义码等。采用字符码2时,口的字符码是p,其上排同义码是0,下排同 义码是“;”,下下排同义码是“/”;p的下档同义码是P。

十全简笔方案的基本码由主码(主输入码或主字符码)表示,它们 的七个同义码仅用来为字、词编制缩略码,而且仅用为字、词缩略码 的最后一码(尾码),其中下档(Shift)同义码则仅用作词码及词缩略码 的尾码。在简笔输入法的述语中,汉字基本码是指按简笔编码规则为 汉字编出的代码(包括输入码及其字符码),由汉字基本码出发按简笔 输入方案的缩码规则编出的短码叫缩略码。因此,简笔输入方案中的 基本码是相对于缩略码而言。

十全简笔输入方案的词码

本方案的词编码规则与我们的上一专利(95112526.5)一样,并 且也是用最后一码击下档键来与字码相区别。不愿意击下档键的用户 可以用加击一键来代替。

    十全简笔方案的汉字缩略码

为了进一步缩短码长,提高编码效率和降低重码率,对高频汉字, 分别取其基本码的第一码,或第一、第二两码,或前三码作为其缩略 码。而缩码字的尾码,分别用主码和它的其它三种上档同义码表示, 因此,对每一个汉字基本输入码,至多可以编出四个缩略码。在用简 笔方案输入汉字,如该字或词不足5码,且最后一码是主码,则必须加 击一次空格键作为该字的输入结束标志,最后一码是其他七种同义码 时就不必,同义码本身就是汉字、汉词输入的结束标志。在十全简笔 输入法的一种键盘设计方案中为使所有标点符号和数目字均可由ASC II西文键盘直接输入,规定数字与标点符号不能作为汉字的首码,只 能作为汉字或汉词的尾码,即数字和标点符号不能作为单键的缩略码。 也就是说,限定任意汉字、汉词的首码只能是大小写52个英文字母中 的某一个。在这样的十全简笔输入法中,可以由ASCII键盘直接输入 标点符号和数目字。只有在汉字的输入过程中数字和标点符号才用作 汉字代码。一个汉字的输入一旦完成,数字和标点符号立即恢复其原 来的代码功能。

十全简笔方案的汉词缩略码

本发明规定,对一个缩码字,出以该字为领头字的一个高频双 字词,把这个高频双字词也编成缩略码,其缩略码与其首字的缩略码 一样,只是词缩略码的尾码是其首字的缩略码尾码的下档同义码,例 如“这”字的缩码是e,则高频双字词“这样”的单键缩码是E。

上述的规定只是在单键缩略码中有少数违例,在词的双键或三键 缩略码中则无例外。词缩略码的这种设计可以大大降低专职录入员的 缩略码记忆量。

十全简笔输入法的数字码

从第六节知,十个数字是十个基本字形码的同义码(见表一第七列 数字码1)。在十全简笔汉字输入法中,数字同义码不能作为汉字、汉 词的首码而只作为尾码用。但是在数字码输入状态下,数字就可作为 主码,实现汉字的数字码全能输入。这时,既可以用顶排数字键,也 可以单手击ASCII键盘右侧的数字小键盘实现CJK大字符集汉字的有 效输入。

如果为了与汉字笔画的传统表示法一致,以下的十全简笔数字码 (即表一的最后第八列数字码2)也是可以的。

在数字码输入的这个方案中,前四个笔画的数字码与传统文字学 一致,而折则分为左折和右折两个,分别由5、6表示,7表示日(第七 天是星期日),8正好与八字形一致,口字与O同形。上述方案也很易记 住。

用ASCII键盘上的数字小键盘单手输入汉字时,数字小键盘上的 十-*/·等五个符号依所列优先顺序作为重码选择键。并且用这五个 符号的头四个作尾码为汉字编制缩略码。办法是,第八节中汉字缩略 码以同一排字符为尾码的,在这时,其尾码仍改用原来的主码,但后 缀以上述四个符号中的一个。和字符缩略码相比,数字缩略码的长度 增加了1。

用数字小键盘作十全简笔汉字输入时,词码通过加击·(del)键与 字码相区别,因此,数字型词缩略码的长度也比字符型词缩略码多一 码。

十全简笔汉字输入的二种输入方式

十全简笔输入方案重码率和重码度已经够低,使得可以采用以下 两种免去人工重码选择操作的输入方式。

(一)完全的盲打方式

操作员只看文稿,不监视荧光屏,完全盲打输入汉字。这样的输 入方式最轻松,由于方案重码率而导致的少量错字可以在校稿时纠正。

(二)半盲打方式

这时操作员监视每次所输入的汉字,看它是不是刚才所输入的目 标字。如果是,接着输入下一字。如果不是,立即击一键表示否定, 随即开始输入下一字。否定键最好使用空格键也可以使用数字键2。这 种方式同样免去了重码选择的麻烦,节省了眼力、心力和时间,但由 于方案重码率而产生的输入错误已极少,本方案这种出错率可低于万 分之三,即远远低于操作员本身击键产生的误码率。

本文发布于:2024-09-22 15:42:06,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/69934.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议