G06F3/023
1.本发明的汉字层次解析汉字与符号编码输入方法,特征在于:
其汉字编码的部件和基本部件
1)汉字部件
本发明认为,一切具有构字能力的笔画、成字及其变形体、相对独立的非成字笔画组合 体都是汉字的部件,如:
笔画:“丿一亅 丿丶”是“我”字的部件;“丿一一乚”是“毛”字的部件,
“毛”及其变形体“ ”是“笔、氅、橇、毯、毡”等字的部件,
“亦”及其变形体“ ”是“迹、跡、弈、奕、变、恋、孪”等字的部件,
“艹、扌、氵、、”等传统的非成字部首分别是“花、菜、打、、笔、答、跑、 跳”等字的部件,
“ (两横)、 (三横)、 丨丨(两竖)、 (横两竖)、艹(横两竖)、 [竖折]、 [折横横]” 等非成字笔画组合体,分别是“且、耳、其、具、直、坚、兼、妻、坚”等字的部件,
本发明确定“键盘应是中国人的第二支笔”,坚持对汉字实施“书写”层次解析编码,因 此,本发明认定汉字部件和汉字基本部件的根据是:除“口、匚”两个传统部首外,无论是 成字部件还是非成字部件,都必须是连续书写的笔画所构成,
如,“戊”在“成、咸、威……”等字的书写过程中,不是连续书写的笔画或部件的组合, 因此,本发明认为“戊”不是“成、咸、威……”等字的部件或基本部件,以“威”字为例, 本发明认为“厂一女 丿丶”才是“威”字的部件或基本部件;
2)本发明的汉字基本部件
本发明的汉字基本部件为:
①45个笔画基本部件:笔画是最重要的基本部件,它们是构成汉字的基本元素,因此, 本发明将通过解析《现代汉语规范字典》的汉字解析出的不同形态的45个笔画纳入基本部件;
②201组汉字部首及其56个部首的变形体:基于GF0012-2009《GB13000.1字符集汉 字部首归部规范》的201组汉字部首绝大多数是汉字的表义部件且构字量大,同时,这些部 首是汉字教学必教必学的汉字部首,不同文化背景的用户都熟知,因此,本发明将201组汉 字部首及56个成字部首的变形体纳入基本部件;
③75个笔画组合体基本部件
为保证本发明的汉字编码都能取得完整的汉字部件信息,从而体现汉字结构的整体性和 认知性,将75个顺序书写的非传统、无名称的笔画组合体纳入基本部件,如: [竖折部]、 [两横部]、 [三横部]、艹[横两竖部]”、 [折两点部]、 [折两竖横部]、 [横三竖部]、 [折横横部]”、 [撇竖横部]、 [折横部];
3)汉字基本部件的名称及其码元
①成字基本部件的音码与码元:
成字基本部件的名称就是其成字本身,本发明以汉字拼音首字母为汉字的音码,汉字的 音码为成字基本部件的码元,
多音字基本部件的码元:多音字有多少个拼音首字母不同的字音,就有多少个不同的码 元,如:
无[mó/wú]有“m、w”两个码元;齐[jì/qí]有“j、q”两个码元;
谷[gǔ/yù]有“g、y”两个码元;疋[yǎ/pǐ/shū]有“y、p、s”三个码元;
生僻字基本部件的码元:
具有传统俗成名称的生僻字基本部件,既有生僻字的码元,又有传统俗成名称的码元, 如:
匚[fāng]有传统名称“匠字框”,因此,匚有“f”和“j”两个码元,
冂[jǒng]有传统名称“同字框”,因此,冂有“j”和“t”两个码元;
对于没有传统俗成名称的生僻字部件,以顺序书写其基本部件的笔画名称的组合并冠以 “部”为其名称,相同的笔画可用笔画名称加笔画数为其名称,名称的首字音码为码元,因 此,没有传统俗成名称的生僻字部件既有其成字的码元又有笔画组合名称的码元,如:
巛[cuān]有笔画组合名称“三折部”,因此,巛有“c”和“s”两个码元,
彐[jì]有笔画组合名称“折横横部”,因此,彐有“j”和“z”两个码元,
凵[kǎn/qiǎn]有笔画组合名称“折竖部”,因此,凵有“k、q、z”三个码元;
成字部首的变形体基本部件的名称及其码元:根据成字部首的变形体基本部件在所构汉 字中的部位或起的作用,以“某字旁、某字头、某字底……”命名,如:
143羊( )部的“ ”,分别在“翔、羟”等字的旁边,因此命名为“羊字旁”,码 元为“y”;“、”在“着、差、羞、盖、美、羔”等字的头部,因此“、”命名为“羊 字头”,码元为“y”,
79牛(牜)部中的“牜”本命名为“为“牛字旁”,码元为“n”,“”命名为“牛字头”, 码元为“n”,
“ ”是91“风部”中的“风”的变形体,命名为“风字框”,码元为“f”,
“ ”是150“走部”中的“走”的变形体,命名为“走字框”,码元为“z”,
有些成字部首的变形很大,失去了其归部成字的字形特征,但还具有成字部首的表义属 性,对这类部首的命名,本发明既兼顾其字形特征又兼顾其表义特征对其进行命名,设置码 元,如:
86爪(爫)部”中的“爫”,命名为“撇点爪”,码元为“p”,
95火(灬)部中的“灬”命名为“四点火”,码元为“s”;
②笔画基本部件的名称及其码元
本发明将45个笔画基本部件分为八部分,以名称的首字音码为码元:
“一 ”为“横”,名称为“横部”;“横”的音码为“h”,因此“一 ”的码元为 “h”,
“丨”为“竖”,名称为“竖部”,码元为“s”,
“亅 ”为“勾”,名称为“勾部”;码元为“g”,
“丿 ”为“撇”,名称为“撇部”,码元为“p”
“、 ”为“点”,名称为“点部”,码元为“d”,
“ ”为“捺”,名称为“捺部”,码元为“n”
“乛 ”为“折”,名称为“折部”,码元为“z”,
“乚 ”为“复折”,名称为“复折部”,码元为“f”;
②非成字基本部件的名称及其码元
具有传统名称的非成字部件名称及其码元:具有传统名称的非成字基本部件以其传统名 称为其名称,名称的首字音码为码元,如:
宀:宝盖儿,码元为“b”,艹:草字头,码元为“c”,扌:提手旁,码元为“t”,
讠:言字旁,码元为“y”,衤:衣字旁,码元为“y”,阝:耳刀旁,码元为“e”;
无名称的非成字基本部件的名称及其码元:本发明的75个笔画组合体基本部件是无名称 的非成字基本部件,本发明以顺序书写无名称的非成字基本部件的笔画名称的组合并冠以 “部”为其名称,相同的笔画可用笔画名称加笔画数为其名称,名称的首字音码为码元,如:
“”是顺序书写“一丿”的组合,命名为“横撇部”,码元为“h”,
“ ”是顺序书写“一 丿”的组合,命名为“横折撇部”,码元为“h”,
同理:
“ ”:折横横部,码元为“z”,“卄”:横两竖部,码元为“h”,
“”:横两竖横部,码元为“h”,“ ”:横横竖竖横部,码元为“h”,
“ ”:四竖部,码元为“s”,“ ”:横四竖横部,码元为“h”;
4)汉字基本部件的编码
为使教师在汉字教学中实时调用汉字的基本部件,以键盘书写代替“板书”讲授和演绎 汉字的结构和汉字的书写,必须对汉字的基本部件进行编码,才能实现教师顺序输入汉字的 基本部件的码元,调出汉字的基本部件,讲授和演绎汉字的结构和汉字的书写过程,
①成字基本部件的编码:成字基本部件的编码方法与本发明的汉字三键形码、三键形音 码、三键音形码、四键形码、四键形音码、四键音形码编码相同;
②成字部首的变形体基本部件的编码:本发明对成字部首的变形体基本部件设置了三键 编码、四键编码:
顺序取成字部首变形体基本部件名称前三个汉字的码元的组合为三键编码,名称不足三 个字的以“a”补足三键,
顺序取成字部首变形体基本部件名称前四个汉字的码元的组合为四键编码,名称不足四 个字的以“a”补足四键,如:
“牜(牛字旁)”的三键编码为[nzp],四键编码为[nzpa],
“ (鬼字框)”的三键编码为[gzk],四键编码为[gzka],
“爫(撇点爪)”的三键编码为[pdz],四键编码为[pdza],
“灬(四点火)”的三键编码为[sdh],四键编码为[sdha];
③笔画基本部件的编码:本发明对笔画基本部件设置了三键编码、四键编码,
顺序取笔画基本部件名称前三个汉字的码元的组合为三键编码,名称不足三个字的以“a” 补足三键,
顺序取笔画基本部件名称前四个汉字的码元的组合为四键编码,名称不足四个字的以“a” 补足四键,如:
横部(一 )的三键编码为[hba],四键编码为[hbaa],
勾部(亅 )的三键编码为[gba],四键编码为[gbaa],
折部(乛 …)的三键编码为[zba],四键编码为[zbaa],
复折部(乚 …)的三键编码为[fzb],四键编码为[fzba];
④非成字基本部件的编码:本发明对非成字基本部件设置了三键编码、四键编码:
顺序取非成字基本部件名称前三个汉字的码元的组合为三键编码,名称不足三个字的以 “a”补足三键,
顺序取非成字基本部件名称前四个汉字的码元的组合为四键编码,名称不足四个字的以 “a”补足四键,如:
具有传统名称的非成字基本部件的编码:
“艹(草字头)”的三键编码为[czt],四键编码为[czta],
“扌(提手旁)”的三键编码为[tsp],四键编码为[tspa],
“纟(乱纠丝)”的三键编码为[ljs],四键编码为[ljsa];
75个笔画组合体基本部件的编码:
“三(三横部)”的三键编码为[shb],四键编码为[shba],
“ (撇竖横部)”的三键编码为[psh],四键编码为[pshb],
“卄(横两竖部)”的三键编码为[hls],四键编码为[hlsb],
“ (折横横部)”的三键编码为[zhh],四键编码为[zhhb],
“ (横横竖竖横部)”的三键编码为[hhs],四键编码为[hhss];
5)基本部件的兼容码元
①汉字的兼容音码与汉字基本部件的兼容码元
为充分利用计算机的26个字母键,实现汉字部件码元的合理分布,减小汉字编码输入的 重码率,本发明设:
“i”为拼音以“ch”或“sh”开头的汉字的兼容音码,因此,“i”为拼音以“ch”或“sh” 开头的汉字基本部件的兼容码元,如:
“i”为“尺、虫、车、出”或“竖、十、尸、山”等汉字的兼容音码,因此,“i”为“尺、 虫、车、出”或“竖、十、尸、山”等汉字基本部件的兼容码元;
“v”为拼音以“sh”或“ch”开头的汉字的兼容音码,因此,“v”为拼音以“sh”或“ch” 开头的汉字基本部件的兼容码元,如:
“v”为“竖、十、尸、山”或“尺、虫、车、出”等汉字的兼容音码,因此,“v”为“竖、 十、尸、山”或“尺、虫、车、出”等汉字基本部件的兼容码元;
“o”为拼音以“yu”或“zh”开头的汉字的兼容音码,因此,“o”为拼音以“yu”或“zh” 开头的汉字基本部件的兼容码元,如:
“o”为“鱼、雨、羽、玉”或“折、支、止、至”等汉字的兼容音码,因此,“o”为“鱼、 雨、羽、玉”或“折、支、止、至”等汉字基本部件的兼容码元;
“u”为拼音以“zh”或“yu”开头的汉字的兼容音码,因此,“u”为拼音以“zh”或“yu” 开头的汉字基本部件的兼容码元,如:
“u”为“折、支、止、至”或“鱼、雨、羽、玉”等汉字的兼容音码,因此,“u”为“折、 支、止、至”或“鱼、雨、羽、玉”等汉字基本部件的兼容码元,
是否设置汉字的兼容音码或汉字基本部件的兼容码元,用户可在安装本发明的软件系统 时自行选定,
同样,用户在安装本发明的软件系统时,可自行选择:
“i”是拼音以“ch”开头的汉字的兼容音码还是以“sh”开头的汉字的兼容音码,
“v”是拼音以“sh”开头的汉字的兼容音码还是以“ch”开头的汉字的兼容音码,
“o”是拼音以“yu”开头的汉字的兼容音码还是以“zh”开头的汉字的兼容音码,
“u”是拼音以“zh”开头的汉字的兼容音码还是以“yu”开头的汉字的兼容音码;
②汉字部件的分流兼容码元
为使汉字部件的码元在键盘上分布合理,减少汉字输入的重码率,本发明设置:
“a”为“木”的兼容码元,“f”为“扌”的兼容码元,
“q”为“火”的兼容码元,“z”为“禾”的兼容码元;
是否设置“木、扌、火、禾”的兼容码元,用户安装本发明的软件系统时可自行选择;
6)应用造字程序构建了完整的汉字基本部件集
本发明所选用的45个笔画、201组汉字部首及其56个成字部首的变形体、75个笔画组 合体基本部件是汉字识字教学必不可少的,然而,其中的许多基本部件,在《GB13000.1字 符集》中没有,为实现汉字输入与汉字识字教学相整合,使汉字识字教学能应用键盘替代传 统的“板书”,实现生动活泼的汉字教学,实时讲授和演绎汉字的结构、书写成字的动态过程, 本发明应用造字程序造出了GB13000.1字符集中所没有的汉字基本部件,存储在GB13000.1 字符集中相应字符区位代码地址中,构建了一个完整的汉字基本部件集,如:
:区位码为[aaa1], :区位码为[aae8],卄:区位码为[a355], :区位码为[aca7],
:区位码为[acc7], :区位码为[acb3], :区位码为[aaa3],丨丨:区位码为[aab1],
:区位码为[addb], :区位码为[faa4], :区位码为[abf5], :区位码为[a69f];
其汉字层次解析编码输入方法
1)汉字的书写结构特征
为清晰而简捷地叙述本发明的汉字层次解析及编码方法,设:
“b”为顺序书写的汉字部件,“a”为与其相对应的码元,
“b s”为汉字的首笔画,其对应的码元为“a s”,
“b m”为汉字的末笔画,其对应的码元为“a m”,
“W”为汉字,“W y”为汉字的音码,
汉字部件“b 1,b 2,b 3……b n”的集合,简述为“b 1b 2b 3……b n”,
汉字部件码元“a 1,a 2,a 3……a n”的组合,简述为“a 1a 2a 3……a n”;
根据本发明的“汉字是顺序书写不同层次的部件组合”的理据,按汉字的书写规范,将 汉字解析为不同层次的部件集合,直至解析到最后一层全是基本部件为止,表述为:
W b 1b 2b 3…b n其中:
“W”:被解析编码汉字,
“b 1b 2b 3…b n”:为顺序书写的汉字某层次的第一个、第二个、第三个至最后一个部 件的集合,
如果汉字只能解析为一个层次的基本部件的集合,则称之为单层次结构的汉字,如:
“机”只能解析为一个层次的部件集合“ 几”,
“受”只能解析为一个层次的部件集合“爫冖又”,
“直”只能解析为一个层次的部件集合“十 一”;
如果汉字可解析为多个层次的基本部件的集合,则称之为多层次结构的汉字,如:
“授”可解析为“扌受”和“扌爫冖又”两个层次的部件集合,
“镰”可解析为“钅廉”、“钅广兼”、“钅广丷一 ”三个层次的部件集合,
“霭”可解析为“雨谒”、“雨讠曷”、“雨讠日匃”、“雨讠日勹亾”、“雨讠日勹人 ”五个 层次的部件集合;
2)汉字层次解析及全息部件形码、三键形码、四键形码编码输入方法
①汉字层次解析及全息部件形码编码输入方法:汉字的某层次解析为部件集合(b 1b 2b 3…b n),取与部件“b 1、b 2、b 3…b n”相对应的码元“a 1、a 2、a 3…a n”的组合“a 1a 2a 3…a n”为汉字该层次的全息部件形码的编码,表述为:
汉字全息部件形码:W b 1b 2b 3…b n a 1a 2a 3…a n其中:
“W”:被解析编码汉字,
“b 1b 2b 3…b n”:为顺序书写的汉字某层次的第一个、第二个、第三个至最后一个部 件的集合,
“a 1a 2a 3…a n”:为与“b 1b 2b 3…b n”相对应的码元的组合,码元组合“a 1a 2a 3…a n”即为汉字某层次的全息部件形码编码,
顺序输入码元“a 1,a 2,a 3…a n”,即可完成汉字的全息部件形码输入,
单层次结构的汉字只有一个全息部件形码编码,
多层次结构的汉字,可解析多少个层次的部件集合,就有多少个全息部件形码编码,
如,“受、争、直”等单层次结构汉字的解析和全息部件形码的编码为:
“受爫冖又pty”,“争 亅pzg”,“直十 一sssh”,
如,“授、廉、霭”等多层次结构汉字的解析和全息部件形码的编码为:
“授”可解析为“扌受”和“扌爫冖又”两个层次的部件集合,因此,“授”有:“ts” 和“tpty”两个全息部件形码,
“廉”可解析为“广兼”和“广丷一 丨丨 ”两个层次的部件集合,因此,“廉”有:“gj” 和“gdhzlb”两个全息部件形码,
“霭”可解析为“雨谒”、“雨讠曷”、“雨讠日匃”、“雨讠日勹亾”、“雨讠日勹人 ”五 个层次的部件集合,因此,“霭”有:“yy”、“yyh”、“yyrg”、“yyrbw”、“yyrbrz”五个全息 部件形码;
②汉字层次解析及三键形码编码输入方法:汉字的某层次解析为部件集合(b 1b 2b 3…b n),取其前两个部件“b 1、b 2”的码元“a 1、a 2”和最后一个部件“b n”的码元“a n”, 三个码元的组合“a 1a 2a n”为汉字该层次的三键形码的编码,简述为:
三键形码:W b 1b 2b n a 1a 2a n其中:
“W”:被解析编码汉字,
“b 1b 2b n”:汉字某层次的第一个、第二个部件和最后一个部件的集合,
“a 1a 2a n”:为与“b 1b 2b n”相对应的码元的组合,三个码元的组合“a 1a 2a n” 即为汉字某层次的三键形码的编码,
顺序输入“a 1,a 2,a n”三个码元,即可完成汉字的三键形码输入,
单层次结构的汉字只有一个三键形码的编码,
多层次结构的汉字,可解析多少个层次的部件集合,就有多少个三键形码的编码;
如,“受、争、直”等单层次结构汉字:
“受”解析为“爫冖又”,其三键形码的编码为“pty”,
“争”解析为“ 亅”,其三键形码的编码为“pzg”,
“直”解析为“十 一”,其三键形码的编码为“ssh”;
如,“授、镰、霭”等多层次结构的汉字:
“授”解析为“扌爫冖又”时,其三键形码的编码为“tpy”,
“镰”解析为“钅广兼”时,其三键形码的编码为“jgj“,
解析为“钅广丷一 丨丨 ”时,其三键形码的编码为“jgb”,
“霭”解析为“雨讠曷”时,其三键形码的编码为“yyh”,
解析为“雨讠日匃”时,其三键形码的编码为“yyg”,
解析为“雨讠日勹亾”时,其三键形码的编码为“yyw”,
解析为“雨讠日勹人 时”,其三键形码的编码为“yyz”;
如果汉字的某层次只能解析为两个部件的集合(b 1b 2)时,取这两个部件的码元“a 1, a 2”和该汉字的末笔画“b m”的码元“a m”,三个码元的组合“a 1a 2a m”为汉字该层次 的三键形码的编码,如:
“机”的三键形码的编码为“mjf”,其中第三个码元“f”为“机”字的末笔画“ ”的 码元“f”,
“授”解析为“扌受”时,三键形码的编码为“tsn”,其中第三个码元“n”为“授”字 的末笔画“ ”的码元“n”,
“镰”解析为“钅廉”时,三键形码的编码为“jln”,其中第三个码元“n”为“镰”字 的末笔画“ ”的码元“n”,
“霭”解析为“雨谒”时,三键形码的编码为“yyz”,其中第三个码元“z”为“霭”字 的末笔画“ ”的码元“z”;
③汉字层次解析及四键形码编码输入方法
汉字的某层次解析为部件集合(b 1b 2b 3…b n),取其前三个部件“b 1、b 2、b 3”的 码元“a 1、a 2、a 3”和最后一个部件“b n”的码元“a n”,四个码元的组合“a 1a 2a 3 a n”为汉字该层次的四键形码的编码,简述为:
四键形码:W b 1b 2b 3b n a 1a 2a 3a n其中:
“W”被解析编码汉字,
“b 1b 2b 3b n”为汉字某层次的第一、第二、第三和最后一个部件的集合,
“a 1a 2a 3a n”为与“b 1b 2b 3b n”相对应的码元的组合,四个码元的组合“a 1a 2 a 3a n”即为汉字某层次的四键形码的编码,
顺序输入“a 1,a 2,a 3,a n”四个码元,即可完成汉字的四键形码输入,
如,“直、兼、束、重”等单层次结构汉字:
“直”解析为“十 一”,其四键形码的编码为“sssh”,
“兼”解析为“丷一 丨丨 ”,其四键形码的编码为“dhzb”,
“束”解析为“一口丨丿 ”,其四键形码的编码为“hksn”;
如,“授、镰、霭”等多层次结构汉:
“授”解析为“扌爫冖又”时,其四键形码的编码为“tpty”,
“镰”解析为“钅广丷一 丨丨 ”时,其四键形码的编码为“jgdb”,
“霭”解析为“雨讠日匃”时,其四键形码的编码为“yyrg”,
解析为“雨讠日勹亾”时,其四键形码的编码为“yyrw”,
解析为“雨讠日勹人 ”时,其四键形码的编码为“yyrz”;
如果汉字的某层次只能解析为两个部件的集合(b 1b 2)时,取这两个部件的码元“a 1, a 2”和该汉字的首笔画“b s”的码元“a s”和该汉字的末笔画“b m”的码元“a m”,四个 码元的组合“a 1a 2a sa m”为汉字该层次的四键形码的编码,如:
“机”的四键形码的编码为“mjhf”,其中的第三个码元“h”为“机”字的首笔画“一” 的码元“h”,第四个码元“f”为“机”字的末笔画“ ”的码元“f”,
“授”解析为“扌受”时,其四键形码的编码为“tshn”,其中第三个码元“h”为“授” 字的首笔画“一”的码元“h”,第四个码元“n”为“授”字的末笔画“ ”的码元“n”,
“镰”解析为“钅廉”时,其四键形码的编码为“jlpn”,其中第三个码元“p”为“镰” 字的首笔画“ ”的码元“p”,第四个码元“n”为“镰”字的末笔画“ ”的码元“n”,
“霭”解析为“雨谒”时,其四键形码的编码为“yyhz”,其中第三个码元“h”为“霭” 字的首笔画“一”的码元“h”,第四个码元“z”为“霭”字的末笔画“ ”的码元“z”;
如果汉字的某层次只能解析为三个部件的集合“b 1b 2b 3”,取这三个部件的码元“a 1, a 2,a 3”和该汉字的末笔画“b m”的码元“a m”,四个码元的组合“a 1a 2a 3a m”为汉 字该层次的四键形码的编码,如:
“受”解析为“爫冖又”,其四键形码的编码为“ptyn”,其中的第四个码元“n”为“受” 字的末笔画“ ”的码元“n”,
“镰”解析为“钅广兼”时,其四键形码的编码为“jgjn”,其中第四个码元“n”为“镰” 字的末笔画“ ”的码元“n”,
“霭”解析为“雨讠曷”时,其四键形码的编码为“yyhz”,其中第四个码元“z”为“霭” 的末笔画“ ”的码元“z”;
3)汉字层次解析及三键形音码、四键形音码编码输入方法
形音码是形在前,音在后的以形为主的汉字编码输入方法,
①汉字层次解析及三键形音码编码输入方法
汉字的某层次解析为部件集合“b 1b 2b 3…b n”,取其第一个部件“b 1”的码元“a 1” 和最后一个部件“b n”的码元“a n”和汉字“W”的音码“W y”,三个码元的组合“a 1a nW y” 为汉字该层次的三键形音码的编码,简述为:
b 1b nW a 1a nW y其中:
“b 1b n”为汉字某层次的第一个部件和最后一个部件的集合,
“W”:为被解析编码的汉字,又表示在编码中要取其音码“W y”之意,
“a 1a nW y”:为与“b 1b n”相对应的码元“a 1a n”和该汉字“W”的音码“W y”的 组合,三个码元的组合“a 1a nW y”即为汉字该层次的三键形音码的编码,
显然,单层次结构的汉字只有一个三键形音码的编码;
多层次结构的汉字,可以解析为多少个层次的部件集合,就有多少个三键形音码的编码,
顺序输入“a 1,a n,W y”三个码元,即可完成汉字的三键形音码输入,
如,“机、争、直”等单层次结构汉字:
“机”解析为“ 几”,其三键形音码的编码为“mjj”,
“争”解析为“ 亅”,其三键形音码的编码为“pgz”,
“直”解析为“十 一”,其三键形音码的编码为“shz”;
如,“授、镰、霭”等多层次结构汉字的解析和三键形音码:
“授”解析为“扌受”时,其三键形音码的编码为“tss”,
解析为“扌爫冖又”时,其三键形音码的编码为“tys”,
“镰”解析为“钅廉”时,其三键形音码的编码为“jll”,
解析为“钅广兼”时,其三键形音码的编码为“jjl”,
解析为“钅广丷一 丨丨 ”时,其三键形音码的编码为“jbl”法
“霭”解析为“ 谒”时,其三键形音码的编码为“yya”,
解析为“ 讠曷”时,其三键形音码的编码为“yha”,
解析为“ 讠日匈”时,其三键形音码的编码为“yga”;
解析为“ 讠日勹亾”时,其三键形音码的编码为“ywa”,
解析为“ 讠日勹人 ”时,其三键形音码的编码为“yza”;
②汉字层次解析及四键形音码编码输入方法
汉字的某层次解析为部件集合“b 1b 2b 3…b n”,取其前两个部件“b 1,b 2”的码元“a 1,a 2”和最后一个部件“b n”的码元“a n”和汉字“W”的音码“W y”,四个码元的组合“a 1a 2a nW y”为汉字该层次的四键形音码的编码,简述为:
b 1b 2b nW a 1a 2a nW y其中
“b 1b 2b n”:为汉字某层次前两个部件和最后一个部件的集合,
“W”:为被解析编码的汉字,又表示在编码中要取其音码“W y”之意,
“a 1a 2a nW y”:为与“b 1b 2b n”相对应的码元和汉字“W”的音码“W y”的组合,四 个码元的组合“a 1a 2a nW y”为汉字该层次的四键形音码的编码,
单层次结构的汉字只有一个四键形音码的编码,
多层次结构的汉字,可以解析为多少个层次的部件集合,就有多少个四键形音码的编码,
顺序顺入“a 1,a 2,a n,W y”四个码元,即可完成汉字的四键形音码输入,
如,“受、争、兼、直、束、重”等单层次结构汉字的解析和四键形音码:
“受”解析为“爫冖又”,其四键形音码的编码为“ptys”,
“争”解析为“ 亅”,其四键形音码的编码为“pzgz”,
“直”解析为“十 一”,其四键形音码的编码为“sshz”;
如,“授、廉、壁、镰、霭”等多层次结构汉字的解析和四键形音码:
“授”解析为“扌爫冖又”时,其四键形音码的编码为“tpys”,
“镰”解析为“钅广兼”时,其四键形音码的编码为“jgjl”,
解析为“钅广丷一 丨丨 ”时,其四键形音码的编码为“jgbl”,
“霭”解析为“雨讠曷”时,其四键形音码的编码为“yyha”,
解析为“雨讠日 ”时,其四键形音码的编码为“yyga”,
解析为“雨讠日勹亾”时,其四键形音码的编码为“yywa”,
解析为“雨讠日勹人 ”时,其四键形码的编码为“yyza”;
如果汉字的某层次只能解析为两个部件的集合“b 1b 2”,取这两个部件的码元“a 1,a 2”和该汉字的末笔画“b m”的码元“a m”和汉字“W”的音码“W y”,四个码元的的组合“a 1a 2a mW y”为汉字该层次的四键形音码的编码,如:
“机”只能解析为“ 几”,其四键形音码的编码为“mjfj”,其中的第三个码元“f”是 “机”字的末笔画“ ”的码元“f”,
“授”解析为“扌受”时,其四键形音码的编码为“tsns”,其中的第三个码元“n”是 “授”字的末笔画“ ”的码元“n”,
“镰”解析为“钅廉”时,其四键形音码的编码为“jlnl”,其中的第三个码元“n”为 “镰”字的末笔画“ ”的码元“n”,
“霭”解析为“ 谒”时,其四键形音码的编码为“yyza”,其中的第三个码元“z”为 “霭”字的末笔画“ ”的码元“z”;
4)汉字层次解析及三键音形码、四键音形码编码输入方法
音形码是音在前,形在后的以形为主的汉字编码输入方法,
①汉字层次解析及三键音形码编码输入方法
汉字的某层次解析为部件集合“W b 1b 2b 3…b n”,取汉字“W”的音码“W y”和该层次 的第一个部件“b 1”的码元“a 1”和最后一个部件“b n”的码元“a n”,三个码元的组合 “W ya 1a n”为汉字该层次的三键音形码的编码,简述为:
Wb 1b n W ya 1a n其中:
“W”:为被解析编码的汉字,又表示在编码中要取其音码“W y”之意,
“b 1b n”为某层次的第一个部件和最后一个部件的集合,
“W ya 1a n”为汉字“W”的音码“W y”和与“b 1b n”相对应的码元“a 1a n”的组合, 三个码元的组合“W ya 1a n”为汉字该层次的三键音形码的编码,
显然,单层次结构的汉字只有一个三键音形码的编码,
多层次结构的汉字,可以解析为多少个层次的部件集合,就有多少个三键音形码的编码,
顺序输入“W y,a 1,a n”三个码元,即可完成汉字三键音形码的输入,
如,“受、争、直”等单层次结构汉字:
“受”只能解析为“爫冖又”,其三键音形码的编码为“spy”,
“争”只能解析为“ 亅”,其三键音形码的编码为“zpg”,
“直”只能解析为“十 一”,其三键音形码的编码为“zsh”;
如,“授、镰、霭”等多层次结构汉字:
“授”解析为“扌受”时,其三键音形码的编码为“sts”,
解析为“扌爫冖又”时,其三键音形码的编码为“sty”,
“镰”解析为“钅廉”时,其三键音形码的编码为“ljl”,
解析为“钅广兼”时,其三键音形码的编码为“ljj”,
解析为“钅广丷一 丨丨 ”时,其三键音形码的编码为“ljb”,
“霭”解析为“ 谒”时,其三键音形码的编码为“ayy”,
解析为“ 讠曷”时,其三键音形码的编码为“ayh”,
解析为“ 讠日匃”时,其三键音形码的编码为“ayg”,
解析为“ 讠日勹亾”时,其三键音形码的编码为“ayw“,
解析为“ 讠日勹人 ”时,其三键音形码的编码为“ayz”;
②汉字层次解析及四键音形码编码输入方法
汉字的某层次解析为部件集合“W b 1b 2b 3…b n”,取汉字“W”的音码“W y”和该层次 前两个部件“b 1,b 2”的码元“a 1,a 2”和最后一个部件“b n”的码元“a n”,四个码元 的组合“W ya 1a 2a n”为该层次四键音形码的编码,简述为:
W b 1b 2b n W ya 1a 2a n其中:
“W”:既为被解析编码的汉字,又表示在编码中要取其音码“W y”之意,
“b 1b 2b n”:为汉字某层次前两个部件和最后一个部件的集合;
“W ya 1a 2a n”:为汉字“W”的音码“W y”和与“b 1b 1b n”相对应的码元“a 1a 2a n” 的组合,四个码元的组合“W ya 1a 2a n”为汉字该层次的四键音形码的编码,
单层次结构的汉字只有一个四键音形码的编码;
多层次结构的汉字,可以解析为多少个层次的部件集合,就有多少个四键音形码的编码,
顺序输入“W y,a 1,a 2,a n”四个码元,即完成汉字的四键音形码输入,
如“受、争、直”等单层次结构汉字:
“受”只能解析为“爫冖又”,其四键音形码的编码为“spty”,
“争”只能解析为“ 亅”,其四键音形码的编码为“zpzg”,
“直”只能解析为“十 一”,其四键音形码的编码为“zssh”;
如,“授、镰、霭”等多层次结构汉字:
“授”解析为“扌爫冖又”时,其四键音形码的编码为“stpy”,
“镰”解析为“钅广兼”时,其四键音形码的编码为“ljgj”,
解析为“钅广丷一 丨丨 ”时,其四键音形码的编码为“ljgb”,
“霭”解析为“ 讠曷”时,其四键音形码的编码为“ayyh”,
解析为“ 讠日匃”时,其四键音形码的编码为“ayyg”,
解析为“ 讠日勹亾”时,其四键音形码的编码为“ayyw”,
解析为“ 讠日勹人 ”时,其四键音形码的编码为“ayyz”;
如果汉字的某层次只能解析为两个部件的集合“b 1b 2”,则取汉字“W”的音码“W y”和 部件“b 1,b 2”的码元“a 1,a 2”和该汉字的末笔画“b m”的码元“a m”,四个码元的组 合“W ya 1a 2a m”为汉字该层次的四键音形码的编码,如:
“机”只能解析为“ 几”,其四键音形码的编码为“jmjf”,其中的第四个码元“f”是 “机”字的末笔画“ ”的码元“f”,
“授”解析为“扌受”时,其四键音形码的编码为“stsn”,其中的第四个码元“n”是 “授”字的末笔画“ ”的码元“n”,
“镰”解析为“钅廉”时,其四键音形码的编码为“ljln”,其中的第四个码元“n”为 “镰”字的末笔画“ ”的码元“n”,
“霭”解析为“雨谒”时,其四键音形码的编码为“ayyz”,其中的第四个码元“z”为“霭” 字的末笔画“ ”的码元“z”;
其词语编码输入方法
为提高汉字词语输入的准确率、自动上屏率,本发明设置了首字定向联想词语输入方法,
首字定向联想词语输入的编码为:W·a 2a 3a 4…a n其中:
“W”:词语的第一个汉字(首字),
“·”:点击“F11键(或F12或Shift键)”,
“a 2a 3a 4…a n”为词语的第二个、第三个至最后一个汉字的音码组合,
输入词语的第二个汉字的音码“a 2”,则完成两字词语的输入,
顺序输入词语的第二个至最后一个汉字的音码“a 2”至“a n”,则完成多字词语的 输入,
如输入以“马”字为首字的两字词语“马赫”,其操作步骤如下:
①输入首字“马”,
②点击“F1键(或F12键或Shift键)”,
③输入“赫”字的音码“h”后,此时,视屏给出:
“1.马号2.马虎3.马赫”
④点击数字键“3”,即完成两字词语“马赫”的输入;
如,输入词语“”:
①输入首字“马”,
②点击“F1键(或F12键或Shift键)”,
③顺序输入“首是瞻”的音码“ssz”,即完成词语“”的输入;
本发明的首字定向联想词语输入方法,实质是用户输入词语的首字后,再顺序输入词语 的第二个、第三个至最后一个汉字的音码“a 2a 3…a n”,系统即按词语的第二个至最后一 个汉字的音码的序列,搜索编码为“首字·a 2a 3a 4…a n”的词语,当搜索到的词语是唯一 的,词语便自动上屏;若有多个编码为“首字·a 2a 3a 4…a n”相同的词语时,系统即按汉 字的音码的序列给出所有的词语,当输入到“首字·a 2a 3…a i…”时,如果这个词语是唯 一的多字词语,这个多字词语便自动上屏,而不必继续顺序输入其他汉字的音码,如:
“中国人民解放军”的编码为“中·grmjfj”,但当输入到“中·grmj”时,“中国人民 解放军”是唯一的多字词语,自动上屏,完成输入,无需再输入“fj”两个音码,
同理:“中国人民政治协商会议”的编码为“中·grmzzxshy”,当输入到“中·grmz”时, “中国人民政治协商会议”自动上屏,完成输入,不必再输入“治协商会议”等字的音码 “zxshy”;
其符号编码输入方法
1)符号名称
本发明将符号分为字母类符号和非字母类符号两大类,
131个字母类符号:
①31个汉语拼音声调符,具有传统的名称,其传统名称为汉语拼音声调符的名称,如:
“ā”:阿一声,“á”:阿二声,“ǎ”:阿三声,“à”:阿四声,“a”:阿轻声,
“ǖ”:迂一声,“ǘ”:迂二声,“ǚ”:迂三声,“ǜ”:迂四声,“ü”:迂轻声;
②48个希腊字母,具有传统的中文译音名称,其中文译音为希腊字母的名称,如:
“α”:阿儿法,“β”;贝塔,“λ”:兰姆搭,“δ”:待儿塔,“π”:派,
“∑”:西格马,“ξ”:柯西,“Ω”:欧米咖,“ε”:艾普西隆,“ρ”:柔;
③52个双字节大小写英文字母,本发明分别将其以大写、小写英文字母命名,如:
A(大写A),a(小写a),B(大写B),b(小写b),Z(大写Z),z(小写z);
209个非字母类符号:
①中文标点符号43个,具有传统的名称,其传统名称为中文标点符号的名称,如:
……(省略号),《》(书名号),?(问号),§(章节号),々(同上符),·(间隔号),
②74个数理符号,具有传统的名称,其传统名称为数理符号的名称,如:
“⊙”:圆,“∠”:角,“◇”:棱形,“△”:三角形,“◎”:同心圆, “∵”:因为,“∴”:所以,“∫”:积分符,“f”:函数符,“∮”:环积分;
③罗马数字22个,具有传统的名称,其传统名称为罗马数字的名称,如:
I(罗马一),II[罗马二],V(罗马五),VIII(罗马八);
④特定符号61个,具有特定的名称,特定名称为特定符号的名称,如:
℃(摄氏度),°F(华氏度),pH(PH值),¥(人民币、货币符),$(美元),%(百分号), ‰(千分号),♀(雌性符), (圈正),☆(五星);
⑤双字节阿拉伯数字10个,本发明分别将其命名为:
0(阿零),1(阿一),2(阿二),3(阿三),4(阿四),
5(阿五),6(阿六),7(阿七),8(阿八),9(阿九);
⑥双字节数字序号60个,本发明将其全部命名,如:
1.(一点),2.(二点),3.(三点),18.(十八点),19.(十九点),20.(二十点);
(1)(括号一),(2)(括号二),(3)(括号三),(19)(括号十九),(20)(括号二十);
(一)[括号一],(二)(括号二),(三)(括号三),(九)(括号九),(十)(括号十);
①[圈一],②(圈二),③(圈三),⑩(圈十);
⑦有些符号在不同的领域或学科有不同的名称,如:
“∑”有“西格马”、“和”、“积和”三个名称,
“@”有“圈a”、“单价符”两个名称,
“¥”有“人民币”、“货币符”两个名称;
2)符号编码输入方法
与本发明的非成字基本部件的编码方法一样,本发明以符号名称的汉字的音码组合为符 号的编码,
①符号的三键形码编码输入方法:
顺序取符号名称前三个汉字的音码组合为符号的三键形码编码,
名称不足三个汉字的字母类符号,用字母“e”补足三键,为字母类符号的三键形码,
名称不足三个汉字的非字母类符号,用字母“a”补足三键,为非字母类符号的三键形码, 如:
字母类符号的三键形码编码:
ā(阿一声)编码为[ays],á(阿二声)编码为[aes],ǎ(阿三声)编码为[ass],
à(阿四声)编码为[ass],a(阿轻声)编码为[aqs],
π(派)编码为[pee],α(阿儿法)编码为[aef],β(贝塔)编码为[bte],
γ(咖马)编码为[gme],∑(西格马)编码为[xgm],ε(艾普西隆)编码为[apx];
非字母类符号的三键形码编码:
∠(角)编码为[jaa],⊙(圆)编码为[yaa],%(百分号)编码为[bfh],
①(圈一)编码为[qya],?(问号)编码为[wha],≥(大于等于)编码为[dyd];
②符号的四键形码编码输入方法:
顺序取符号名称前四个汉字的音码组合为符号的四键形码编码,
名称不足四个汉字的字母类符号,用字母“e”补足四键,为字母类符号的四键形码,
名称不足四个汉字的非字母类符号,用字母“a”补足四键,为非字母类符号的四键形码, 如:
字母类符号的四键形码编码:
ā(阿一声)编码为[ayse],á(阿二声)编码为[aese],ǎ(阿三声)编码为[asse],
à(阿四声)编码为[asse],a(阿轻声)编码为[aqse],
π(派)编码为[peee],α(阿儿法)编码为[aefe],β(贝塔)编码为[btee],
γ(咖马)编码为[gmee],∑(西格马)编码为[xgme],ε(艾普西隆)编码为[apxl];
非字母类符号的四键形码编码:
∠(角)编码为[jaaa],⊙(圆)编码为[yaaa],%(百分号)编码为[bfha],
①(圈一)编码为[qyaa],?(问号)编码为[whaa],≥(大于等于)编码为[dydy];
其功能设置
本发明设置了字词跟踪查询检索功能、汉字字音查询检索功能、字音查询检索汉字功能、 汉字层次解析编码查询检索功能、汉字动态摹写功能、汉字默写功能、用户自定义词语功能、 词语释义查询检索功能,
为便于系统的输入状态的切换,在位于视屏左下方的输入状态显示栏中设置了“ZY(字 音)”、“JB(解编)”、“ZC(字词)”、“SX(书写)”四个对话框,其中:
“ZY”:汉字字音查询检索和由字音(或模糊字音)查询检索汉字对话框;
“JB”:查询检索汉字的层次解析编码对话框;
“ZC”:查询检索词语,自定义词语,词语释义对话框;
“SX”:汉字动态摹写和汉字默写对话框,
1)字词跟踪查询检索功能
本发明设置了字词跟踪查询检索功能,即输入一个汉字后,所有以该字为首字的词语则 按其第二个汉字的音码“a→z”的序列,顺序分屏跟随,用户可直接用相应的数字键选择 或翻屏键选所需的词语,
如,输入完“歧”字后,以“歧”字为首字的词语则按其第二个汉字的音序顺序排列, 分屏跟随待选:
“1.歧出 2.歧化 3.歧视 4.歧见 5.歧路 6.歧路亡羊 7.歧义、8.歧异”
此时:点击数字键“8”即可完成词语“歧异”的输入,
点击数字键“6”即可完成词语“歧路亡羊”的输入,
如果完成词语首字的输入后,所需的词语不在首屏出现,可用“=”键或“PgDn”键翻 屏查完成所需词语的输入,如输入词语“”,完成首字“马”的输入后,首屏给出: “1.马鞍 2.马鞍山 3.马鞍子 4.马帮 5.马弁 6.马鞭 7.马表 8.马不停蹄 9.马不歇鞍 0.马刺”
没有词语“”,用“=”键或“PgDn”键翻屏即可到:
“1.马赫……7.马术 8. 9.马失前蹄……”
点击数字键“8”即完成词语“”的输入,
对于由多个词语组成的复合词语或特定词语,本发明设置了字词连续跟踪功能,输入复 合词语或特定词语的前两个汉字后,所有以这两个汉字开头的复合词语或特定词语则按其第 三个汉字的音码“a→z”的序列,顺序分屏跟随待选,如,完成词语“中国”的输入后, 以“中国”为前两个汉字的特定词语则按第三个汉字的音码序列顺序列出:
“1.中国共产党、2.中国人民银行、3.中国人民解放军、4.中国政府……”即跟踪显示 在视屏上待选,此时,点击空格键或数字键“1”,即完成“中国共产党”的输入,点击“数 字键“3”,即完成“中国人民解放军”的输入,
2)汉字动态摹写功能
为满足汉字书写教学的需求和用户对汉字的书写练习,本发明设置了汉字动态摹写功能, 为实施汉字的动态摹写,本发明应用造字程序造出了3500个常用字的基本部件书写组合体, 建立了汉字动态摹写数据库hzdtmxsjk,
汉字动态摹写的操作方法和步骤如下:
①输入或选中被摹写的汉字;
②用鼠标左键点击屏幕左下方的输入状态栏中的“SX”框,即由汉字输入状态切换到汉 字动态摹写状态;
③顺序输入被摹写汉字的基本部件的码元,系统即顺序演绎被摹写汉字的基本部件及基 本部件动态组合成字的过程;
④完成上述三步操作后,用户可根据提示,选择退出汉字动态摹写状态,也可选择全部 或部分摹写的信息;
如,要演绎“我”字的动态摹写,其操作步骤如下:
输入或选中“我”字;
点击屏幕左下方的输入状态栏中的“SX”框,屏幕给出汉字动态摹写框:
输入“我”字的第一个基本部件“丿”的码元“p”后,视屏给出:
继续输入“我”字的第二个基本部件“一”的码元“h”后,视屏给出:
继续输入“我”字的第三个基本部件“亅”的码元“g”后,视屏给出:
直至输入“我”字的最后一个基本部件“丶”的码元“d”,视屏给出:
此时:
键入“N”即退出汉字动态摹写状态;
若要检索出“我”字的动态摹写的全部信息,键入“Y”或用鼠标点击“Y”,即检索出:
“我[wǒ]phghzpd丿一亅 丿丶 我”
若要检索出“我”字的动态摹写的部件组合信息,如选中“丿一亅 丿丶 我”后,键入“Y”或用鼠标点击“Y”,即检索出“丿一亅 丿丶 我”,
需要指出的是,不同的用户对同一个汉字的基本部件的认知不同,如“藏”字,有的用 户认定“藏”是顺序书写基本部件“艹厂 丆臣 丿丶”而成,有的认定是顺序书写基本部 件“艹一爿臣 丿丶”而成,据此,本发明设置了汉字由不同的基本部件组合而成的动态摹 写,如,“藏”是由基本部件“艹厂 丆臣 丿丶”组合而成的动态摹写为:
“藏”是由基本部件“艹一片臣 丿丶”组合而成的动态摹写为:
又如,有的用户认为“垂”字是“独体字”,只能解析为基本笔画,即“垂”只能是顺序 书写“丿一丨一丨丨一一”基本笔画的组合“ 垂”,而有的用户认定“垂”字 是顺序书写“ 一丨丨一一”基本部件的组合“ 垂”,还有的用户认为“垂”字是顺 序书写“ 艹一一”基本部件的组合“ 垂”,据此,“垂”有如下三种由不同的基本部 件组合而成的动态摹写:
3)汉字默写功能
为实施汉字默写功能,本发明对GBK字符集中的简体汉字,建立了应用汉字基本部件的 汉字默写数据库hzmxs jk,
汉字默写的方法和操作步骤如下:
①用鼠标点击屏幕左下方的输入状态栏中的“SX”框,由汉字输入状态切换到汉字默写 状态,屏幕给出汉字默写框:
②顺序输入被默写汉字的基本部件的码元,
③点击“End”键,结束汉字默写,
此时,如果被默写的汉字是唯一的,系统即给出被默写汉字的字音、顺序输入的码元及 其与之相对应的基本部件、被默写的汉字等信息,
如果被默写的汉字是重码字,用户可用数字键选择被默写的汉字,选定后,系统即给出 被默写汉字的字音、码元及其与之相对应的基本部件等全部信息,
④若要检索被默写汉字的全部信息,可键入或用鼠标点击“Y”,检索出全部被默写汉字 的字音、顺序输入的码元及其与之相对应的基本部件等信息;选中被默写汉字的部分信息, 键入或用鼠标点击“Y”,即可检索出被选中的信息,键入“N”退出汉字的默写状态,返回汉 字输入状态,
如:默写“弊”字:
用鼠标点击屏幕左下方的输入状态栏中的“SX”框,屏幕显示:
顺序输入“弊”字的基本部件的码元“dtspdfg”,屏幕显示:
点击“End”,屏幕显示:
此时:
若键入或用鼠标点击“Y”,即检索出“弊[bì]dtspdfg丷冂丨丿丶攵廾弊”信息,
若选中“丷冂丨丿丶攵廾弊”,键入或用鼠标点击“Y”,即检索出“丷冂丨丿丶攵廾弊”, 若键入或用鼠标点击“N”,则退出汉字的默写状态,返回汉字输入状态,
如,默写“蔼”字,按上述操作步骤,完成“cyrbrz”,点击“Eed”键,屏幕显示:
如,默写“羯”字,按上述操作步骤,完成“yrbrz”,点击“End”键,屏幕显示:
此时,键入数字“2”,选中“羯”字,屏幕显示:
至此,用户可进行“羯”字的默写的相关信息检索或退出,
同理,默写“醭”字,按上述操作步骤,完成“yydspn”,点击“End”键,屏幕显示:
此时,键入数字“1”,选中“醭”,屏幕显示:
至此,用户可进行“醭”字的默写的相关信息检索或退出;
4)汉字字音查询检索功能
为提高用户对汉字的认知能力,本发明设置了汉字字音查询检索功能,其操作方法和步 骤为:
①用鼠标选中被查字,
②用鼠标点击屏幕左下方输入状态栏中的“ZY”框,系统即给出被查汉字的字音,
如:选中“堃”字,则屏幕给出“堃”字的字音:
此时,键入“y”,即检索出“堃[kūn]”;键入“n”,则退出汉字字音查询检索状态返回 汉字输入状态,
5)由字音查询检索汉字功能
为解决用户对“只知字音而不知字形”汉字的输入问题,本发明设置了由字音查询检索 汉字功能、由汉字模糊字音(不带声调符的汉字字音)查询检索汉字功能,
①由字音查询检索汉字的方法
其操作方法和步骤如下:
a.输入并选中被查询汉字的字音,
b.用鼠标点击屏幕左下方的输入状态栏中的“ZY”框,系统即分屏给出所有字音相同的 汉字,用户可点击数字键或翻屏键选所需汉字,
如,只知道“缘”字的字音“yuán”,忘记了“缘”字的字形,则:
a.输入并选中“缘”的字音“yuán”,
b.用鼠标点击屏幕左下方的输入状态栏中的“ZY”框,系统即分屏给出字音为“yuán” 的所有汉字,待用户查询检索:
“1.元 2.芫 3.园 4.员 5.沅 6.垣 7.爰 8.袁 9.原 0.圆”
第一屏无“缘”字,用“=”键或“PgDn”键翻屏查到:
“1.鼋 2.援 3.湲 4.媛 5.缘 6.塬 7.猿 8.源 9.嫄 0.辕”,
此时,点击数字键“5”,即完成“缘”字的查询检索输入,
②由汉字的模糊字音查询检索汉字的方法
其操作方法和步骤如下:
a.输入并选中被查询汉字的模糊字音,
b.用鼠标点击屏幕左下方汉字输入状态栏的“ZY”框,系统即分屏给出所有模糊字音相 同的汉字,待用户查询检索,
如,输入并选中“缘”字的汉语拼音字母集合“yuan”,需要翻屏3次到:
“1.援 2.湲 3.媛 4.缘 5.塬 6.猿 7.源 8.嫄 9.辕 0.橼”
此时,点击数字键“4”完成“缘”字的查询检索输入;
6)汉字层次解析编码查询检索功能
为使汉字层次解析编码应用于汉字识字教学,使用户掌握汉字不同层次的结构特征,提 高对汉字的认知能力,本发明设置了汉字层次解析编码查询检索功能,其操作步骤如下:
①选中被查汉字,
②用鼠标点击屏幕左下方输入状态栏中的“JB”框,系统即给出被查汉字的字音、层次 解析、不同层次的形码、形音码、音形码及其部件名称等信息,
如用户当前采用的是本发明的四键形码输入方法,选中“窗”字,点击屏幕左下方输入 状态栏中的“JB”框,系统即给出“窗”字的字音、层次解析及全息部件形码和不同层次的 四键形码的编码等信息:
如用户当前采用的是本发明的四键形音码输入方法,选中“窗”字,点击屏幕左下方输 入状态栏中的“JB”框,系统即给出“窗”字的字音、层次解析及全息部件形码和不同层次 的四键形音码的编码等信息:
如用户当前采用的是本发明的四键音形码输入方法,选中“窗”字,点击屏幕左下方输 入状态栏中的“JB”框,系统即给出“窗”字的字音、层次解析及全息部件形码和不同层次 的四键音形码的编码等信息:
7)用户自定义词语建立功能
不同职业、不同专业的用户都有与自己专业密切相关的专用词语,为使这些用户能准确、 快捷地输入专用词语,本发明设置了用户自定义词语建立功能,其建立方法和操作步骤:
①输入并复制(或在当前文本中复制)所需建立的自定义词语“W 1W 2W 3……W n”;
②用鼠标点击屏幕左下方输入状态栏中的“ZC”框,屏幕显示:
其中:
自定义词语:W 1W 2W 3……W n:是输入并选定的自定义词语,其中:
W 1为词语首字;W 2为词语的第二个汉字,……W n为词语最后一个汉字;
如果系统中已有用户输入并选中的词语,系统则给出“已有词语W 1W 2W 3……W n”,此时, 用户可点击“N键”退出建立用户自定义词语状态,返回汉字输入状态,
编码:“a 2a 3…a n”:是需要用户输入的自建词语的第二个至最后一个汉字的音码,用 户可顺序输入词语“W 1W 2W 3……W n”的第二个汉字“W 2”的音码“a 2”至最后一个汉字“W n” 的音码“a n”,点击“y”确定,即完成用户自定义词语的建立,
如,用户要建立专用词语“壳幔结构”,输入并选定“壳幔结构”,用鼠标点击屏幕左下 方输入状态栏中的“ZC”框,屏幕显示:
此时,顺序输入“壳幔结构”的第二个、第三个和最后一个汉字“幔结构”的音码“mjg”, 屏幕显示:
此时,点击“Y”即完成自定义词语“壳幔结构”的建立,系统返回汉字输入状态, 点击“N”,放弃自定义词语的建立,系统返回汉字输入状态;
8)词语释义查询检索功能
汉字识字教学中,需要准确、简捷、快速调用词语、成语解释,用户在阅读电子文本时, 往往也要查询相关词语,为此,本发明设置了词语释义查询检索功能,
其操作方法和步骤如下:
①输入并选中(或在文本中选中)需要查询检索的词语,
②用鼠标点击屏幕左下方输入状态栏中的“ZC”框,系统即给出选中的词语释义,
如,输入并选中或在文本中选中“刚愎”并点击“ZC”框,屏幕即显示出词语“刚愎” 的释义:
如,输入并选中或在文本中选中“刚愎自用”并点击“ZC”框,屏幕即显示出词语“刚 愎自用”的释义:
汉字层次解析汉字与符号编码输入方法
第一部分 发明名称及其技术领域
发明名称:汉字层次解析汉字与符号编码输入方法
发明所属技术领域:本发明属中文信息处理领域
第二部分 发明目的及发明内容
一、发明目的及科技思路
“中国人需要形码或以形为主的汉字编码”;“键盘是中国人的第二支笔”是本发明人矢志不渝的信念和追求。实现汉字的键盘书写,使中国人都能根据自己所熟知的汉字书写和对汉字的认知能力,无记忆、无障碍地应用本发明的形码、形音码、音形码汉字编码输入方法,建立自己的认知输入体系,这是本发明致力于解决的课题。
本发明人二十余年来所努力践行,努力追求实现的目标是:
汉字编码必须体现汉字的文化内涵,符合中国人对汉字的认知理念。因此,汉字编码输入必须实现“科学性、规范性、认知性、实用性相统一”;
中国人对汉字的认知源于汉字识字教学。因此,必须实现“汉字输入与汉字识字教学相统一”。
实践已经证明了,能够输入汉字或快速输入汉字的汉字输入方法,不一定能应用于汉字识字教学,也不一定符合中国人对汉字的认知理念。当今被绝大多数用户所应用的汉字输入方法,也不一定是中国人真正需要的汉字编码。只有符合汉字识字教学规范、符合中国人对汉字的认知理念的汉字编码输入方法,才能使用户在输入汉字的过程中,巩固、提高对汉字的认知能力。才能使中文信息处理继承和宏扬汉字的民族文化传统。
起点高,落点低,是本发明所遵循的原则。
起点高:必须使本发明的汉字编码能充分体现汉字的文化特征,揭示汉字的文化内涵,符合汉字识字教学规范,符合中国人对汉字的认知理念。
落点低:必须使本发明的汉字编码既能满足汉字识字教学“与识渐进”的需求;又要实现不同文化背景的用户都能根据自己对汉字的认知能力,无记忆、无障碍地建立自己的认知输入体系的目标。
遵循汉字的书写规范,对汉字实施书写层次解析编码,是本发明对汉字实施形码、形音码、音形码的关键技术。
二、发明内容
1.对GBK字符集中的汉字实施了全息部件形码、三键形码、四键形码、三键形音码、四键形音码、三键音形码、四键音形码编码;设置了汉字字音查询检索功能、由字音查询检索汉字功能,汉字层次解析编码查询检索功能,汉字动态摹写和汉字默写功能;
2.对45个笔画基本部件、201组汉字部首及其56个部首的变形体、75个笔画组合体基本部件设置了三键编码和四键编码输入方法;
3.本发明采用词语首字定向联想词语输入方法,并设置了字词跟踪查询检索功能、词语释义查询检索功能;
4.本发明对GBK字符集中的350个符号设置了三键编码和四键编码输入方法。
第三部分 汉字编码的部件和基本部件
一、汉字部件
本发明认为,一切具有构字能力的笔画、成字及其变形体、相对独立的非成字笔画组合体都是汉字的部件。如:
笔画:“丿一亅丿、”是“我”字的部件;“丿一一乚”是“毛”字的部件;
“毛”及其变形体“”是“笔、氅、橇、毯、毡”等字的部件;
“虎”及其变形体“”是“琥、唬、彪、甝、虝”等字的部件;
“亦”及其变形体“”是“迹、跡、弈、奕、变、恋、孪”等字的部件;
“艹、扌、氵、、”等传统的非成字部首分别是“花、菜、打、、笔、答、跑、跳”等字的部件;
“(两横)、(三横)、丨丨(两竖)、(横两竖)、卄(横两竖)、[竖折]、[折横横]”等非成字笔画组合体,分别是“且、耳、其、具、直、坚、兼、妻、坚”等字的部件。
本发明确定“键盘应是中国人的第二支笔”,坚持对汉字实施“书写”层次解析编码。因此,本发明认定汉字部件和汉字基本部件的根据是:除“口、匚”两个传统部首外:
无论是成字部件还是非成字部件,都必须是连续书写的笔画所构成。
如,“戊”在“成、咸、威……”等字的书写过程中,不是连续书写的笔画或部件的组合,因此,本发明认为“戊”不是“成、咸、威……”等字的部件或基本部件。以“威”字为例,本发明认为“厂一女丿、”才是“威”字的部件或基本部件。
同理,“戈”在“成、咸、威、载、裁”等字的书写过程中,不是连续书写的笔画或部件的组合,因此,“戈”不是“成、咸、威、载、裁”等字的部件或基本部件。以“裁”字为例,本发明认为“衣丿、”或“一衣丿、”才是“裁”字的部件或基本部件。
二、认定汉字基本部件的理据
无论是汉字识字教学,还是形码或以形为主的汉字编码都需要汉字的基本部件。一般情况下,汉字的基本部件是不能再解析的部件。
本发明认定汉字基本部件的理据是:
1.体现汉字文化内涵或结构特征的表义部件必须定为汉字的基本部件;
2.既要保证汉字解析编码体现汉字结构的整体性和认知性,不能将汉字解析得过于零散,又要确保绝大多数汉字尽可能有三个或三个以上的基本部件;
3.汉字的基本部件不能过多,也不能过少。
汉字基本部件过多,必然导致难以识别和记忆的困难;汉字基本部件过少,又会导致许 多表义部件的缺失,使汉字解析得过于零散,难以使汉字编码体现其整体性和认知性。
三、本发明的汉字基本部件
基于本发明认定汉字基本部件的理据,本发明的汉字基本部件为:
①45个笔画基本部件:
笔画是最重要的基本部件,它们是构成汉字的基本元素。因此,本发明将通过解析《现代汉语规范字典》的汉字解析出的不同形态的45个笔画纳入基本部件;
②201组汉字部首及其56个部首的变形体:
基于GF0012-2009《GB13000.1字符集汉字部首归部规范》的201组汉字部首绝大多数是汉字的表义部件且构字量大;同时,这些汉字部首都是汉字教学必教必学的,不同文化背景的用户都熟知,因此,本发明将201组汉字部首及其56个成字部首的变形体纳入基本部件;
③75个笔画组合体基本部件
为保证本发明的汉字编码都能取得完整的汉字部件信息,从而体现汉字结构的整体性和认知性,将75个顺序书写的非传统、无名称的笔画组合体纳入基本部件。
如:[竖折部]、[两横部]、[三横部]、卄[横两竖部]、[折两点部]、[折两竖横部]、[横三竖部]、[折横横部]”、[撇竖横部]、[折横部]……
四、汉字基本部件的名称及其码元
(一)成字基本部件的名称及其码元
成字基本部件的名称就是其成字本身。
1.成字的音码与成字基本部件的码元
本发明以汉字的拼音首字母为汉字的音码,成字的音码为成字基本部件的码元。
2.多音字基本部件的码元
多音字有多少个拼音首字母不同的字音,就有多少个不同的码元。如:
无[mó/wú]有“m、w”两个码元;齐[jì/qí]有“j、q”两个码元;
糸[mì/sī]有“m、s”,两个码元;谷[gǔ/yù]有“g、y”两个码元;
疋[yǎ/pǐ/shū]有“y、p、s”三个码元;隹[zhuī/cuī/weī]有“z、c、w”三个码元;
……
3.生僻字基本部件的码元
①具有传统俗成名称的生僻字基本部件,既有生僻字的码元,又有传统俗成名称的码元。如:
匚[fāng]有传统名称“匠字框”,因此,匚有“f”和“j”两个码元;
冂[jǒng]有传统名称“同字框”,因此,冂有“j”和“t”两个码元;
卩[jié]有传统名称“单耳旁”,本发明取“耳旁”,因此,卩有“j”和“e”两个码元;
攵[pū]有传统名称“反文ㄦ”,因此,攵有“p”和“f”两个码元;
夂[zhǐ/zhōne]有传统名称“折文”,本发明取“文”,因此,夂有“z”和“w”两个码元;
……
②没有传统俗成名称的生僻字部件的码元
本发明以顺序书写生僻字基本部件的笔画名称的组合并冠以“部”为其名称,相同的笔画可用笔画名称加笔画数为其名称,名称的首字音码为码元。因此,没有传统俗成名称的生僻字部件既有其成字的码元,又有笔画组合名称的码元。如:
巛[cuān]有笔画组合名称“三折部”,因此,巛有“c”和“s”两个码元;
彐[jì]有笔画组合名称“折横横部”,因此,彐有“j”和“z”两个码元;
彑[jì]有笔画组合名称“折折横部”,因此,彑有“j”和“z”两个码元;
屮[chè/cǎo]有笔画组合名称“折竖竖部”,因此,屮有“c”和“z”两个码元;
凵[kǎn/qiǎn]有笔画组合名称“折竖部”,因此,凵有“k、q、z”三个码元;
……
4.成字部首的变形体基本部件的名称及其码元
根据成字部首的变形体基本部件在所构汉字中的部位或起的作用,以“某字旁、某字头、某字底……”命名。如:
143羊()部的“”,分别在“翔、羟”等字的旁边,因此命名为“羊字旁”,码元为“y”;“、”在“着、差、羞、盖、美、羔”等字的头部,因此“、”命名为“羊字头”,码元为“y”;
同理:
77水(氵氺)部中的“氺”命名为“水字底”,码元为“s”;
79牛(牜)部中的“牜”本命名为“为“牛字旁”,码元为“n”,“”命名为“牛字头”,码元为“n”;
80手(扌)部中的“、”分别命名为“手字旁、手字头”,码元为“s”;
98心(忄)部中的“”为“竖心底”,码元为“x”;
122“耒”的变形体“”命名为“耒字旁”,码元为“l”;
126西(覀)部中的“覀”命名为“西字头”,码元为“x”;
193“麻”的变形体“”命名为“麻字头”,码元为“m”;
又如:
“”是91“风部”中的“风”的变形体,命名为“风字框”,码元为“f”;
“”是150“走部”中的“走”的变形体,命名为“走字框”,码元为“z”;
同理:
“”为“乙字框”,码元为“y”;“”为“尢字框”,码元为“y”;
“”为“支字框”,码元为“z”;“”为“瓦字框”,码元为“w”;
“”为“瓜字框”,码元为“g”;“”为“鬼字框”,码元为“g”;
……
有些成字部首的变形很大,失去了其归部成字的字形特征,但还具有成字部首的表义属性。对这类部首的命名,本发明既兼顾其字形特征又兼顾其表义特征对其进行命名,设置码元。如:
22刀(刂)部中的“”,命名为“撇折刀”,码元为“p”;
86爪(爫)部”中的“爫”,命名为“撇点爪”,码元为“p”;
95火(灬)部中的“灬”命名为“四点火”,码元为“s”;
……
(二)笔画基本部件的名称及其码元
本发明将45个笔画基本部件分为八部分,以名称的首字音码为码元:
“一 ”为“横”,名称为“横部”;“横”的音码为“h”,因此“一”的码元为“h”:
“丨”为“竖”,名称为“竖部”,码元为“s”;
“亅”为“勾”,名称为“勾部”;码元为“g”;
“丿”为“撇”,名称为“撇部”,码元为“p”;
“、”为“点”,名称为“点部”,码元为“d”;
“”为“捺”,名称为“捺部”,码元为“n”;
“乛ㄑㄥ”为“折”,名称为“折部”,码元为“z”;
“乚乙”为“复折”,名称为“复折部”,码元为“f”。
(三)非成字基本部件的名称及其码元
本发明以非成字基本部件的名称的首字音码为码元。
1.具有传统名称的非成字部件名称及其码元
具有传统名称的非成字基本部件以其传统名称为其名称,名称的首字音码为码元。如:
宀:宝盖儿,码元为“b”;艹:草字头,码元为“c”;扌:提手旁,码元为“t”;
氵:三点水,码元为“s”;:竹字头,码元为“z”;:足字旁,码元为“z”;
辶:走之底,码元为“z”;廴:建走之,码元为“j”;纟:乱纠丝,码元为“l”;
饣:食字旁,码元为“s”;礻:示字旁,码元为“s”;忄:竖心旁、码元为“x”;
讠:言字旁,码元为“y”;衤:衣字旁,码元为“y”;阝:耳刀旁,码元为“e”;
……
2.无名称的非成字基本部件的名称及其码元
本发明的75个笔画组合体基本部件是无名称的非成字基本部件。
本发明以顺序书写无名称的非成字基本部件的笔画名称的组合并冠以“部”为其名称,相同的笔画可用笔画名称加笔画数为其名称,其名称的首字音码为其码元,如:
“”是顺序书写“一丿”的组合,命名为“横撇部”,码元为“h”;
“||、”是顺序书写“丨丨”的组合,命名为“两竖部”,码元为“l”;
“”是顺序书写“丨”的组合,命名为“竖折部”,码元为“s”;
“”是顺序书写“一丿”的组合,命名为“横折撇部”,码元为“h”;
“”是顺序书写“一一一”的组合,命名为“三横部”,码元为“s”;
同理:
“”:两横部,码元为“l”;“三”:三横部,码元为“s”;
“”:竖横部,码元为“s”;“”:撇横部,码元为“p”:
“‘”:横三竖部,码元为“h”;“”:撇竖三横部,码元为“p”;
“”:折横横部,码元为“z”;“卄”:横两竖部,码元为“h”;
“”:横两竖横部,码元为“h”;“”:横横竖竖横部,码元为“h”;
“”:四竖部,码元为“s”;“”:横四竖横部,码元为“h”;
……
五、汉字基本部件的编码
为使教师在汉字教学中实时调用汉字的基本部件,以键盘书写代替“板书”讲授和演绎汉字的结构和汉字的书写,必须对汉字的基本部件进行编码。才能实现教师顺序输入汉字的基本部件的码元,调出汉字的基本部件,讲授和演绎汉字的结构和汉字的书写过程。如:
输入码元“sssh”调出部件“十一”讲授“直”的书写组合过程“直”;
输入码元“sshb”调出部件“一八”讲授“具”的书写组合过程“具”;
输入码元“dlby”调出部件“亠丨丨又”讲授“变”的书写组合过程“亠变”;
输入码元“sklst”调出部件“立十土”讲授“壁”的书写组合过程“壁”;输入码元“yyrbrz”调出部件“讠日勹人”讲授“霭”的书写组合过程“霭”;输入码元“phrshh”调出部件“一曰丨一一”讲授“重”的书写组合过程“重”。
(一)成字基本部件的编码
1.成字基本部件的编码方法与本发明的汉字的三键形码、三键形音码、三键音形码、四键形码、四键形音码、四键音形码编码相同,此处不赘述;
2.成字部首的变形体基本部件的编码:
本发明对成字部首的变形体基本部件设置了三键编码、四键编码:
顺序取成字部首的变形体基本部件名称前三个汉字的码元的组合为三键编码。名称不足三个字的以“a”补足三键。
顺序取成字部首的变形体基本部件名称前四个汉字的码元的组合为四键编码。名称不足四个字的以“a”补足四键。如:
“牜(牛字旁)”的三键编码为[nzp];四键编码为[nzpa];
“(手字旁)”的三键编码为[szp];四键编码为[szpa];
“(止字旁)”的三键编码为[zzp];四键编码为[zzpa];
“(麻字头)”的三键编码为[mzt];四键编码为[mzta];
“(风字框)”的三键编码为[fzk];四键编码为[fzka];
“(鬼字框)”的三键编码为[gzk];四键编码为[gzka];
“(四字头)”的三键编码为[szt];四键编码为[szta];
“爫(撇点爪)”的三键编码为[pdz];四键编码为[pdza];
“灬(四点火)”的三键编码为[sdh];四键编码为[sdha];
……
(二)笔画基本部件的编码
本发明对笔画基本部件设置了三键编码、四键编码:
顺序取笔画基本部件名称前三个汉字的码元的组合为三键编码。名称不足三个字的以“a”补足三键。
顺序取笔画基本部件名称前四个汉字的码元的组合为四键编码。名称不足四个字的以“a”补足四键。如:
横部(一)的三键编码为[hba];四键编码为[hbaa];
勾部(亅))的三键编码为[gba];四键编码为[gbaa];
折部(乛…)的三键编码为[zba];四键编码为[zbaa];
复折部(乚…)的三键编码为[fzb];四键编码为[fzba];
……
(三)非成字基本部件的编码
本发明对非成字基本部件设置了三键编码、四键编码:
顺序取非成字基本部件名称前三个汉字的码元的组合为三键编码。名称不足三个字的以“a”补足三键。
顺序取非成字基本部件名称前四个汉字的码元的组合为四键编码。名称不足四个字的以“a”补足四键。
1.具有传统名称的非成字基本部件的编码:
“艹(草字头)”的三键编码为[czt];四键编码为[czta];
“扌(提手旁)”的三键编码为[tsp];四键编码为[tspa];
“氵(三点水)”的三键编码为[sds];四键编码为[sdsa];
“(竹字头)”的三键编码为[zzt];四键编码为[zzta];
“纟(乱纠丝)”的三键编码为[ljs];四键编码为[ljsa];
“宀(宝盖儿)”的三键编码为[bge];四键编码为[bgea];
……
2.75个笔画组合体基本部件的编码:
“(两横部)”的三键编码为[lhb];四键编码为[lhba];
“三(三横部)”的三键编码为[shb]四键编码为[shba];
“(竖折部)”的三键编码为[szb]四键编码为[szba];
“(四竖部)”的三键编码为[ssb];四键编码为[ssba];
“ス(折点部)”的三键编码为[zdb];四键编码为[zdba];
“丨丨(两竖部)”的三键编码为[lsb];四键编码为[lsba];
“(撇竖横部)”的三键编码为[psh];四键编码为[pshb];
“卄(横两竖部)”的三键编码为[hls];四键编码为[hlsb];
“(折横横部)”的三键编码为[zhh];四键编码为[zhhb];
“(竖左三横部)”的三键编码为[SZS];四键编码为[szsh];
“(竖右边三横)”的三键编码为[sys];四键编码为[sysh];
“(横四竖横部)”的三键编码为[hss];四键编码为[hssh];
“(横横竖竖横部)”的三键编码为[hhs];四键编码为[hhss];
……
六、基本部件的兼容码元
1.汉字的兼容音码与汉字基本部件的兼容码元
根据以汉字拼音首字母为汉字音码的原则,计算机的字母键“i、u、v”不能做汉字的音码;以“o”键为音码的汉字也很少。分析表明,按“以音托形”设置汉字部件码元的原则,构字量大的汉字部件的码元集中在“c、s、y、z”4个字母键上,造成本发明汉字编码重码率高的缺陷。
为充分利用计算机的26个字母键,实现汉字部件码元的合理分布,减小汉字编码输入的重码率。本发明设:
“i”为拼音以“ch”或“sh”开头的汉字的兼容音码。因此,“i”为拼音以“ch”或“sh”开头的汉字基本部件的兼容码元。如:
“i”为“尺、虫、车、出”或“竖、十、尸、山”等汉字的兼容音码。因此,“i”为“尺、虫、车、出”或“竖、十、尸、山”等汉字基本部件的兼容码元;
“v”为拼音以“sh”或“ch”开头的汉字的兼容音码。因此,“v”为拼音以“sh”或“ch”开头的汉字基本部件的兼容码元。如:
“v”为“竖、十、尸、山”或“尺、虫、车、出”等汉字的兼容音码。因此,“v”为“竖、十、尸、山”或“尺、虫、车、出”等汉字基本部件的兼容码元;
“o”为拼音以“yu”或“zh”开头的汉字的兼容音码。因此,“o”为拼音以“yu”或“zh”开头的汉字基本部件的兼容码元。如:
“o”为“鱼、雨、羽、玉”或“折、支、止、至”等汉字的兼容音码。因此,“o”为“鱼、雨、羽、玉”或“折、支、止、至”等汉字基本部件的兼容码元;
“u”为拼音以“zh”或“yu”开头的汉字的兼容音码。因此,“u”为拼音以“zh”或“yu”开头的汉字基本部件的兼容码元。如:
“u”为“折、支、止、至”或“鱼、雨、羽、玉”等汉字的兼容音码。因此,“u”为“折、支、止、至”或“鱼、雨、羽、玉”等汉字基本部件的兼容码元。
是否设置汉字的兼容音码或汉字基本部件的兼容码元,用户可在安装本发明的软件系统时自行选定。
同样,用户在安装本发明的软件系统时,可自行选择:
“i”是拼音以“ch”开头的汉字的兼容音码还是以“sh”开头的汉字的兼容音码;
“v”是拼音以“sh”开头的汉字的兼容音码还是以“ch”开头的汉字的兼容音码;
“o”是拼音以“yu”开头的汉字的兼容音码还是以“zh”开头的汉字的兼容音码;
“u”是拼音以“zh”开头的汉字的兼容音码还是以“yu”开头的汉字的兼容音码。
2.汉字部件的分流兼容码元
分析表明,按“以音托形”设置汉字部件码元的原则:
“a”键不是本发明的基本部件的码元,因而,在形码的编码中,“a”键基本无用;
“f”键只是本发明的笔画基本部件复折部(乚乙)的码元,不是本发明的其它汉字基本部件的码元;
“q”键只是本发明的基本部件“青、欠”的码元,其构字量也很少。
反之:
“马、门、木、米”等基本部件的码元为“m”,致使“m”键对汉字编码的承载量极大;
“土、扌、田、冂”等基本部件的码元为“t”,致使“t”键对汉字编码的承载量极大;
“一、火、禾、户”等基本部件的码元为“h”,致使“h”键对汉字编码的承载量极大。
为使汉字部件的码元在键盘上分布合理,减少汉字输入的重码率,本发明设置:
“a”为“木”的兼容码元;“f”为“扌”的兼容码元;
“q”为“火”的兼容码元;“z”为“禾”的兼容码元。
是否设置“木、扌、火、禾”的兼容码元,用户安装本发明的软件系统时,可自行选择。
七、应用造字程序构建了完整的汉字基本部件集
本发明的45个笔画、201组汉字部首及其56个成字部首的变形体、75个笔画组合体基本部件是汉字识字教学必不可少的。然而,其中的许多基本部件,在GB13000.1字符集中没有。为实现汉字输入与汉字识字教学相整合,使汉字识字教学能应用键盘替代传统的“板书”,实现生动活泼的汉字教学,实时讲授和演绎汉字的结构、书写成字的动态过程。本发明应用造字程序造出了GB13000.1字符集中所没有的汉字基本部件,存储在GB13000.1字符集中相应字符区位代码地址中,构建了一个完整的汉字基本部件集。如:
:区位码为[aaa1];:区位码为[aae8];卄:区位码为[a355];:区位码为[aca7];
:区位码为[acc7];:区位码为[acb3];:区位码为[aaa3];丨丨:区位码为[aab1];
:区位码为[addb];:区位码为[faa4];:区位码为[abf5];:区位码为[a69f];
……
45个笔画基本部件的名称、区位码、码元及三键编码、四键编码及构字实例见附表1;
56个成字部首的变形体基本部件的名称、区位码、三键编码、四键编码见附表2;
75个笔画组合体基本部件的名称、区位码、码元、三键编码、四键编码见附表3。
第四部分 汉字层次解析编码输入方法
一、汉字的书写结构特征
为清晰而简捷地叙述本发明的汉字层次解析及编码方法,设:
“b”为顺序书写的汉字部件;“a”为与其相对应的码元;
“bs”为汉字的首笔画;其对应的码元为“as”;
“bm”为汉字的末笔画;其对应的码元为“am”;
“W”为汉字;“Wy”为汉字的音码。
汉字部件“b1,b2,b3……bn”的集合,简述为“b1b2b3……bn”;
汉字部件码元“a1,a2,a3……an”的组合,简述为“a1a2a3……an”;
根据本发明的“汉字是顺序书写不同层次的部件组合”的理据,本发明的汉字层次解析方法为:按汉字的书写规范,将汉字解析为不同层次的部件集合,直至解析到最后一层全是基本部件为止。表述为:
W b1b2b3…bn其中:
“W”:被解析的汉字;
“b1b2b3…bn”:为顺序书写的汉字某层次的第一个、第二个、第三个至最后一个部件的集合;
如果汉字只能解析为一个层次的基本部件的集合,则称之为单层次结构的汉字。如:
“人”只能解析为一个层次的部件集合“丿”;
“机”只能解析为一个层次的部件集合“几”;
“受”只能解析为一个层次的部件集合“爫冖又”;
“争”只解解析为一个层次的部件集合“亅”;
“兼”只能解析为一个层次的部件集合“丷一丨丨”;
“直”只能解析为一个层次的部件集合“十一”;
“束”只能解析为一个层次的部件集合“一口丨丿”;
“重”只能解析为一个次层的部件集合“一曰丨一”。
如果汉字可解析为多个层次的基本部件的集合,则称之为多层次结构的汉字。如:
“授”可解析为“扌受”和“扌爫冖又”两个层次的部件集合;
“廉”可解析为“广兼”和“广丷一丨丨”两个层次的部件集合;
“壁”可解析为“辟土”、“辛土”、“尸口辛土”三个层次的部件集合;
“镰”可解析为“钅廉”、“钅广兼”、“钅广丷一丨丨”三个层次的部件集合;
“霭”可解析为“雨谒”、“雨讠曷”、“雨讠日匃”、“雨讠日勹亾”、“雨讠日勹人”五个层次的部件集合。
统计表明,应用本发明的汉字基本部件和汉字层次解析方法,在现代汉语中约有占总字数7%的汉字是单层次结构汉字,93%的汉字是多层次结构的汉字。
二、汉字层次解析及全息部件形码、三键形码、四键形码编码输入方法
(一)汉字层次解析及全息部件形码编码输入方法
汉字的某层次解析为部件集合(b1b2b3…bn),取与部件“b1、b2、b3…bn”相对应的码元“a1、a2、a3…an”的组合“a1a2a3…an”为汉字该层次的全息部件形码的编码。表述为:
汉字全息部件形码:W b1b2b3…bn a1a2a3…an其中:
“W”:被解析编码汉字;
“b1b2b3…bn”:为顺序书写的汉字某层次的第一个、第二个、第三个至最后一个部件的集合;
“a1a2a3…an”:为与“b1b2b3…bn”相对应的码元的组合,码元组合“a1a2a 3…an”即为汉字某层次的全息部件形码编码。
顺序输入码元“a1,a2,a3…an”,即可完成汉字的全息部件形码输入。
单层次结构的汉字只有一个全息部件形码编码;
多层次结构的汉字,可解析多少个层次的部件集合,就有多少个全息部件形码编码。
如,“人、机、受、争、兼、直、束、重”等单层次结构汉字的解析和全息部件形码的编码为:
“人丿pn”;“机几mj”;
“受爫冖又pty”;“争亅pzg”;
“兼丷一丨丨dhzlb”;“直十一sssh”;
“束一口丨丿hkspn”;“重一曰丨一phrshh”。
如,“授、廉、壁、霭”等多层次结构汉字:
“授”可解析为“扌受”和“扌爫冖又”两个层次的部件集合,因此,“授”有:“ts”和“tpty”两个全息部件形码;
“廉”可解析为“广兼”和“广丷一丨丨”两个层次的部件集合,因此,“廉”有:“gj”和“gdhzlb”两个全息部件形码;
“壁”可解析为“辟土”、“辛土”、“尸口辛土”三个层次的部件集合,因此,
“壁”有:“bt”、“dxt”、“skxt”三个全息部件形码;
“霭”可解析为“雨谒”、“雨讠曷”、“雨讠日匃”、“雨讠日勹亾”、“雨讠日勹人”五个层次的部件集合,因此,“霭”有:“yy”、“yyh”、“yyrg”、“yyrbw”、“yyrbrz”五个全息部件形码。
(二)汉字层次解析及三键形码编码输入方法
汉字的某层次解析为部件集合(b1b2b3…bn),取其前两个部件“b1、b2”的码元“a 1、a2”和最后一个部件“bn”的码元“an”,三个码元的组合“a1a2an”为汉字该层次的三键形码的编码。简述为:
三键形码:W b1b2bn a1a2an其中:
“W”:被解析编码汉字;
“b1b2bn”:汉字某层次的第一个、第二个部件和最后一个部件的集合;
“a1a2an”:为与“b1b2bn”相对应的码元的组合,三个码元的组合“a1a2an”即为汉字某层次的三键形码的编码。
顺序输入“a1,a2,an”三个码元,即可完成汉字的三键形码输入。
单层次结构的汉字只有一个三键形码的编码;
多层次结构的汉字,可解析多少个层次的部件集合,就有多少个三键形码的编码。
如,“受、争、直、兼、束、重”等单层次结构汉字:
“受”解析为“爫冖又”,其三键形码的编码为“pty”;
“争”解析为“亅”,其三键形码的编码为“pzg”;
“直”解析为“十一”,其三键形码的编码为“ssh”;
“兼”解析为“丷一丨丨”,其三键形码的编码为“dhb”;
“束”解析为“一囗丨丿”,其三键形码的编码为“hkn”;
“重”解析为“一曰丨一”,其三键形码的编码为“phh”。
如,“授、廉、壁、镰、霭”等多层次结构的汉字:
“授”解析为“扌爫冖又”时,其三键形码的编码为“tpy”
“廉”解析为“广丷一丨丨”时,其三键形码的编码为:“gdb”;
“壁”解析为“辛土”时,其三键形码的编码为“dxt”;
解析为“尸囗辛土”时,其三键形码的编码为“skt”;
“镰”解析为“钅广兼”时,其三键形码的编码为“jgj“;
解析为“钅广丷一丨丨”时,其三键形码的编码为“jgb”;
“霭”解析为“雨讠曷”时,其三键形码的编码为“yyh”;
解析为“雨讠日匃”时,其三键形码的编码为“yyg”;
解析为“雨讠日勹亾”时,其三键形码的编码为“yyw”;
解析为“雨讠日勹人时”,其三键形码的编码为“yyz”。
如果汉字的某层次只能解析为两个部件的集合(b1b2)时,取这两个部件的码元“a1,a2”和该汉字的末笔画“bm”的码元“am”,三个码元的组合“a1a2am”为汉字该层次的三键形码的编码。如:
“人”解析为“丿”,“人”的三键形码的编码为“pnn”,其中第三个码元“n”为“人”字的末笔画“”的码元“n”。
同理:
“机”的三键形码的编码为“mjf”,其中第三个码元“f”为“机”字的末笔画“”的码元“f”;
“妈”的三键形码的编码为“nmb”,其中第三个码元“h”为“妈”字的末笔画“一”的码元“h”;
“授”解析为“扌受”时,三键形码的编码为“tsn”,其中第三个码元“n”为“授”字的末笔画“”的码元“n”;
“廉”解析为“广兼”时,三键形码的编码为“gjn”,其中第三个码元“n”为“廉”字的末笔画“”的码元“n”;
“壁”解析为“辟土”时,三键形码的编码为“bth”,其中第三个码元“h”为“壁”字的末笔画“一”的码元“h”;
“镰”解析为“钅廉”时,三键形码的编码为“jln”,其中第三个码元“n”为“镰”字的末笔画“”的码元“n”;
“霭”解析为“雨谒”时,三键形码的编码为“yyz”,其中第三个码元“z”为“霭”字的末笔画“”的码元“z”。
(三)汉字层次解析及四键形码编码输入方法
汉字的某层次解析为部件集合(b1b2b3…bn),取其前三个部件“b1、b2、b3”的码元“a1、a2、a3”和最后一个部件“bn”的码元“an”,四个码元的组合“a1a2a3an”为汉字该层次的四键形码的编码。简述为:
四键形码:W b1b2b3bn a1a2a3an其中:
“W”被解析编码汉字;
“b1b2b3bn”为汉字某层次的第一、第二、第三和最后一个部件的集合;
“a1a2a3an”为与“b1b2b3bn”相对应的码元的组合,四个码元的组合“a1a2a3an”即为汉字某层次的四键形码的编码。
顺序输入“a1,a2,a3,an”四个码元,即可完成汉字的四键形码输入。
如,“直、兼、束、重”等单层次结构汉字:
“直”解析为“十一”,其四键形码的编码为“sssh”;
“兼”解析为“丷一丨丨”,其四键形码的编码为“dhzb”;
“束”解析为“一口丨丿”,其四键形码的编码为“hksn”;
“重”解析为“一曰丨一”,其四键形码的编码为“phrh”。
如,“授、廉、壁、镰、霭”等多层次结构汉字:
“授”解析为“扌爫冖又”时,其四键形码的编码为“tpty”;
“廉”解析为“广丷一丨丨”时,其四键形码的编码为“gdhb”;
“壁”解析为“尸口辛土”时,其四键形码的编码为“skxt”;
“镰”解析为“钅广丷一丨丨”时,其四键形码的编码为“jgdb”;
“霭”解析为“雨讠日匃”时,其四键形码的编码为“yyrg”;
解析为“雨讠日勹亾”时,其四键形码的编码为“yyrw”;
解析为“雨讠日勹人”时,其四键形码的编码为“yyrz”。
如果汉字的某层次只能解析为两个部件的集合(b1b2)时,取这两个部件的码元“a1,a2”和该汉字的首笔画“bs”的码元“as”和该汉字的末笔画“bm”的码元“am”,四个码元的组合“a1a2asam”为汉字该层次的四键形码的编码。如:
“人”解析为“丿”时,其四键形码的编码为“pnpn”,其中的第三个码元“p”为“人”字的首笔画“丿”的码元“p”;第四个码元“n”为“人”字的末笔画“”的码元“n”;
“机”的四键形码的编码为“mjhf”,其中的第三个码元“h”为“机”字的首笔画“一”的码元“h”,第四个码元“f”为“机”字的末笔画“”的码元“f”;
“妈”的四键形码的编码为“nmzh”,其中的第三个码元“z”为“妈”字的首笔画“ㄑ”的码元“z”,第四个码元“h”为“妈”字的末笔画“一”的码元“h”;
“授”解析为“扌受”时,其四键形码的编码为“tshn”,其中第三个码元“h”为“授” 字的首笔画“一”的码元“h”,第四个码元“n”为“授”字的末笔画“”的码元“n”;
“廉”解析为“广兼”时,其四键形码的编码为“gjdn”,其中第三个码元“d”为“廉”字的首笔画“丶”的码元“d”,第四个码元“n”为“廉”字的末笔画“”的码元“n”;
“壁”解析为“辟土”时,其四键形码的编码为“btzh”,其中第三个码元“z”为“壁”字的首笔画“”的码元“z”,第四个码元“h”为“壁”字的末笔画“一”的码元“h”;
“镰”解析为“钅廉”时,其四键形码的编码为“jlpn”,其中第三个码元“p”为“镰”字的首笔画“”的码元“p”,第四个码元“n”为“镰”字的末笔画“”的码元“n”;
“霭”解析为“雨谒”时,其四键形码的编码为“yyhz”,其中第三个码元“h”为“霭”字的首笔画“一”的码元“h”,第四个码元“z”为“霭”字的末笔画“”的码元“z”;
如果汉字的某层次只能解析为三个部件的集合“b1b2b3”,取这三个部件的码元“a1,a2,a3”和该汉字的末笔画“bm”的码元“am”,四个码元的组合“a1a2a3am”为汉字该层次的四键形码的编码。如:
“受”解析为“爫冖又”,其四键形码的编码为“ptyn”,其中的第四个码元“n”为“受”字的末笔画“”的码元“n”;
“争”解析为“亅”,其四键形码的编码为“pzgg”,其中的第四个码元“g”为“争”字的末笔画“亅”的码元“g”;
“壁”解析为“辛土”时,其四键形码的编码为“dxth”,其中的第四个码元“h”为“壁”字的末笔画“一”的码元“h”;
“镰”解析为“钅广兼”时,其四键形码的编码为“jgjn”,其中第四个码元“n”为“镰”字的末笔画“”的码元“n”;
“霭”解析为“雨讠曷”时,其四键形码的编码为“yyhz”,其中第四个码元“z”为“霭”的末笔画“”的码元“z”。
汉字层次解析及全息部件形码、三键形码、四键形码的编码范例见表1。
表1.汉字层次解析及全息部件形码、三键形码、四键形码的编码范例
注:“①”:带“*”标识的部件表明有两个或两个以上的码元。为减少篇幅,本表只取其一个码元。
三、汉字层次解析及三键形音码、四键形音码编码输入方法
形音码是形在前,音在后的以形为主的汉字编码输入方法。
(一)汉字层次解析及三键形音码编码输入方法
汉字的某层次解析为部件集合“b1b2b3…bn”,取其第一个部件“b1”的码元“a1”和最后一个部件“bn”的码元“an”和该汉字“W”的音码“Wy”,三个码元的组合“a1anWy”为汉字该层次的三键形音码的编码。简述为:
b1bnW a1anWy其中:
“b1bn”为汉字某层次的第一个部件和最后一个部件的集合;
“W”:为被解析的汉字,又表示在编码中要取其音码“Wy”之意;
“a1anWy”:为与“b1bn”相对应的码元“a1an”和汉字“W”的音码“Wy”的组合,三个码元的组合“a1anWy”即为汉字该层次的三键形音码的编码。
显然,单层次结构的汉字只有一个三键形音码的编码;
多层次结构的汉字,可以解析为多少个层次的部件集合,就有多少个三键形音码的编码。
顺序输入“a1,an,Wy”三个码元,即可完成汉字的三键形音码输入。
如,“人、机、受、争、兼、直、束、重”等单层次结构汉字:
“人”解析为“丿”,其三键形音码的编码为“pnr”;
“受”解析为“爫冖又”,其三键形音码的解析编码为“pys”;
“机”解析为“几”,其三键形音码的编码为“mjj”;
“争”解析为“亅”,其三键形音码的编码为“pgz”
“兼”解析为“丷一丨丨”,其三键形音码的编码为“dbj”;
“直”解析为“十一”,其三键形音码的解析编码为“shz”;
“束”解析为“一口丨丿”,其三键形音码的解析编码为“hns”;
如,“授、廉、壁、镰、霭”等多层次结构汉字的解析和三键形音码:
“授”解析为“扌受”时,其三键形音码的编码为“tss”;
解析为“扌爫冖又”时,其三键形音码的编码为“tys”;
“廉”解析为“广兼”时,其三键形音码的编码为“gjl”;
解析为“广丷一丨丨”时,其三键形音码的编码为“gbl”;
“壁”解析为“辟土”时,其三键形音码的编码为“btb”;
解析为“辛土”时,其三键形音码的编码为“dtb”
解析为“尸口辛土”时,其三键形音码的编码为“stb”;
“镰”解析为“钅廉”时,其三键形音码的编码为“jll”;
解析为“钅广兼”时,其三键形音码的编码为“jjl”;
解析为“钅广丷一丨丨”时,其三键形音码的编码为“jbl”;
“霭”解析为“谒”时,其三键形音码的编码为“yya”;
解析为“讠曷”时,其三键形音码的编码为“yha”;
解析为“讠日匃”时,其三键形音码的编码为“yga”;
解析为“讠日勹亾”时,其三键形音码的编码为“ywa“;
解析为“讠日勹人”时,其三键形音码的编码为“yza”。
(二)汉字层次解析及四键形音码编码输入方法
汉字的某层次解析为部件集合“b1b2b3…bn”,取其前两个部件“b1,b2”的码元“a 1,a2”和最后一个部件“bn”的码元“an”和汉字“W”的音码“Wy”,四个码元的组合“a 1a2anWy”为汉字该层次的四键形音码的编码。简述为:
b1b2bnW a1a2anWy其中
“b1b2bn”:为汉字某层次前两个部件和最后一个部件的集合;
“W”:为被解析的汉字,又表示在编码中要取其音码“Wy”之意;
“a1a2anWy”:为与“b1b2bn”相对应的码元和汉字“W”的音码“Wy”的组合,四个码元的组合“a1a2anWy”为汉字该层次的四键形音码的编码。
单层次结构的汉字只有一个四键形音码的编码;
多层次结构的汉字,可以解析为多少个层次的部件集合,就有多少个四键形音码的编码。
顺序顺入“a1,a2,an,Wy”四个码元,即可完成汉字的四键形音码输入。
如,“受、争、兼、直、束、重”等单层次结构汉字的解析和四键形音码:
“受”解析为“爫冖又”,其四键形音码的编码为“ptys”;
“争”解析为“亅”,其四键形音码的编码为“pzgz”;
“兼”解析为“丷一丨丨”,其四键形音码的编码为“dhbj”;
“直”解析为“十一”,其四键形音码的编码为“sshz”;
“束”解析为“一口丨丿”,其四键形音码的编码为“hkns”;
“重”解析为“一曰丨一”,其四键形音码的编码为“phhc”或“phhz”。
如,“授、廉、壁、镰、霭”等多层次结构汉字的解析和四键形音码:
“授”解析为“扌爫冖又”时,其四键形音码的编码为“tpys”;
“廉”解析为“广丷一丨丨”时,其四键形音码的编码为“gdbl”;
“壁”解析为“辛土”时,其四键形音码的编码为“dxtb”;
解析为“尸口辛土”时,其四键形音码的编码为“sktb”;
“镰”解析为“钅广兼”时,其四键形音码的编码为“jgjl”;
解析为“钅广丷一丨丨”时,其四键形音码的编码为“jgbl”;
“霭”解析为“雨讠曷”时,其四键形音码的编码为“yyha”;
解析为“雨讠日匃”时,其四键形音码的编码为“yyga”;
解析为“雨讠日勹亾”时,其四键形音码的编码为“yywa”;
解析为“雨讠日勹人”时,其四键形码的编码为“yyza”。
如果汉字的某层次只能解析为两个部件的集合“b1b2”,取这两个部件的码元“a1,a 2”和该汉字的末笔画“bm”的码元“am”和该汉字的音码“Wy”,四个码元的的组合“a1a2amWy”为汉字该层次的四键形音码的编码。如:
“人”只能解析为“丿”,其四键形音码的编码为“pnnr”。其中的第三个码元“n”是“人”字的末笔画“”的码元“n”;
“机”只能解析为“几”,其四键形音码的编码为“mjfj”。其中的第三个码元“f”是“机”字的末笔画“”的码元“f”
“授”解析为“扌受”时,其四键形音码的编码为“tsns”。其中的第三个码元“n”是“授”字的末笔画“”的码元“n”;
“廉”解析为“广兼”时,其四键形音码的编码为“gjnl”。其中的第三个码元“n”是“廉”字的末笔画“”的码元“n”;
“壁”解析为“辟土”时,其四键形音码的编码为“bthb”。其中的第三个码元“h”为“壁”字的末笔画“一”的码元“h”;
“镰”解析为“钅廉”时,其四键形音码的编码为“jlnl”。其中的第三个码元“n”为 “镰”字的末笔画“”的码元“n”;
“霭”解析为“谒”时,其四键形音码的编码为“yyza”。其中的第三个码元“z”为“霭”字的末笔画“”的码元“z”。
汉字层次解析及全息部件形码、三键形音码、四键形音码的编码范例见表2
表2.汉字层次解析及全息部件形码、三键形音码、四键形音码的编码范例。
注:“①”:带“*”标识的部件表明有两个或两个以上的码元。为减少篇幅,本表只取其一个码元。
四、汉字层次解析及三键音形码、四键音形码编码输入方法
音形码是音在前,形在后的以形为主的汉字编码输入方法。
(一)汉字层次解析及三键音形码编码输入方法
汉字的某层次解析为部件集合“b1b2b3…bn”,取汉字“W”的音码“Wy”和该层次的第一个部件“b1”的码元“a1”和最后一个部件“bn”的码元“an”,三个码元的组合“Wya1an”为汉字该层次的三键音形码的编码。简述为:
W b1bn Wya1an其中:
“W”:为被解析的汉字,又表示在编码中要取其音码“Wy”之意;
“b1bn”为某层次的第一个部件和最后一个部件的集合;
“Wya1an”:为汉字“W”的音码“Wy”和与“b1bn”相对应的码元“a1an”的组合,三个码元的组合“Wya1an”为汉字该层次的三键音形码的编码。
显然,单层次结构的汉字只有一个三键音形码的编码;
多层次结构的汉字,可以解析为多少个层次的部件集合,就有多少个三键音形码的编码。
顺序输入“Wy,a1,an”三个码元,即可完成汉字三键音形码的输入。
如,“人、机、受、争、兼、直、束、重”等单层次结构汉字:
“人”只能解析为“丿”,其三键音形码的编码为“rpn”;
“受”只能解析为“爫冖又”,其三键音形码的编码为“spy”;
“机”只能解析为“几”,其三键音形码的编码为“jmj”;
“争”只能解析为“亅”,其三键音形码的编码为“zpg”
“兼”只能解析为“丷一丨丨”,其三键音形码的编码为“jdb”;
“直”只能解析为“十一”,其三键音形码的编码为“zsh”;
“束”只能解析为“一口丨丿”,其三键音形码的编码为“shn”;
“重”只能解析为“一曰丨一”;其三键音形码的编码为“cph”或“zph”。
如,“授、廉、壁、镰、霭”等多层次结构汉字:
“授”解析为“扌受”时,其三键音形码的编码为“sts”;
解析为“扌爫冖又”时,其三键音形码的编码为“sty”;
“廉”解析为“广兼”时,其三键音形码的编码为“lgj”;
解析为“广丷一丨丨”时,其三键音形码的编码为“lgb”;
“壁”解析为“辟土”时,其三键音形码的编码为“bbt”;
解析为“辛土”时,其三键音形码的编码为“bdt”
解析为“尸口辛土”时,其三键音形码的编码为“bst”;
“镰”解析为“钅廉”时,其三键音形码的编码为“ljl”;
解析为“钅广兼”时,其三键音形码的编码为“ljj”;
解析为“钅广丷一丨丨”时,其三键音形码的编码为“ljb”;
“霭”解析为“谒”时,其三键音形码的编码为“ayy”;
解析为“讠曷”时,其三键音形码的编码为“ayh”;
解析为“讠日匃”时,其三键音形码的编码为“ayg”;
解析为“讠日勹亾”时,其三键音形码的编码为“ayw“;
解析为“讠日勹人”时,其三键音形码的编码为“ayz”。
(二)汉字层次解析及四键音形码编码输入方法
汉字的某层次解析为部件集合“b1b2b3…bn”,取汉字“W”的音码“Wy”和该层次前两个部件“b1,b2”的码元“a1,a2”和最后一个部件“bn”的码元“an”,四个码元的组合“Wya1a2an”为该层次四键音形码的编码。简述为:
W b1b2bn Wya1a2an其中:
“W”:为被解析的汉字,又表示在编码中要取其音码“Wy”之意;
“b1b2bn”:为汉字某层次前两个部件和最后一个部件的集合;
“Wya1a2an”:为汉字“W”的音码“Wy”和与“b1b1bn”相对应的码元“a1a2an”的组合,四个码元的组合“Wya1a2an”为汉字该层次的四键音形码的编码。
单层次结构的汉字只有一个四键音形码的编码;
多层次结构的汉字,可以解析为多少个层次的部件集合,就有多少个四键音形码的编码。
顺序输入“Wy,a1,a2,an”四个码元,即完成汉字四键音形码的输入。
如“受、争、兼、直、束、重”等单层次结构汉字:
“受”只能解析为“爫冖又”,其四键音形码的编码为“spty”;
“争”只能解析为“亅”,其四键音形码的编码为“zpzg”;
“兼”只能解析为“丷一丨丨”,其四键音形码的编码为“jdhb”;
“直”只能解析为“十一”,其四键音形码的编码为“zssh”;
“束”只能解析为“一口丨丿”,其四键音形码的编码为“shkn”;
“重”只能解析为“一曰丨一”,其四键音形码的编码为“cphh”或“zphh”。
如,“授、廉、壁、镰、霭”等多层次结构汉字:
“授”解析为“扌爫冖又”时,其四键音形码的编码为“stpy”;
“廉”解析为“广丷一丨丨”时,其四键音形码的编码为“lgdb”;
“壁”解析为“辛土”时,其四键音形码的编码为“bdxt”;
解析为“尸口辛土”时,其四键音形码的编码为“bskt”;
“镰”解析为“钅广兼”时,其四键音形码的编码为“ljgj”;
解析为“钅广丷一丨丨”时,其四键音形码的编码为“ljgb”
“霭”解析为“讠曷”时,其四键音形码的编码为“ayyh”;
解析为“讠日匃”时,其四键音形码的编码为“ayyg”;
解析为“讠日勹亾”时,其四键音形码的编码为“ayyw”;
解析为“讠日勹人”时,其四键音形码的编码为“ayyz”。
如果汉字的某层次只能解析为两个部件的集合“b1b2”,则取汉字“W”的音码“Wy”和部件“b1,b2”的码元“a1,a2”和该汉字的末笔画“bm”的码元“am”,四个码元的组合“Wya1a2am”为汉字该层次的四键音形码的编码。如:
“人”只能解析为“丿”,其四键音形码的编码为“rpnn”。其中的第四个码元“n”是“人”字的末笔画“”的码元“n”;
“机”只能解析为“几”,其四键音形码的编码为“jmjf”。其中的第四个码元“f”是“机”字的末笔画“”的码元“f”;
“授”解析为“扌受”时,其四键音形码的编码为“stsn”。其中的第四个码元“n”是“授”字的末笔画“”的码元“n”;
“廉”解析为“广兼”时,其四键音形码的编码为“lgjn”。其中的第四个码元“n”是“廉”字的末笔画“”的码元“n”;
“壁”解析为“辟土”时,其四键音形码的编码为“bbth”。其中的第四个码元“h”为“壁”字的末笔画“一”的码元“h”;
“镰”解析为“钅廉”时,其四键音形码的编码为“ljln”。其中的第四个码元“n”为“镰”字的末笔画“”的码元“n”;
“霭”解析为“雨谒”时,其四键音形码的编码为“ayyz”。其中的第四个码元“z”为“霭”字的末笔画“”的码元“z”。
汉字层次解析及全息部件形码、三键音形码、四键音形码编码的范例见表3
表3.汉字层次解析及全息部件形码、三键音形码、四键音形码编码范例。
注:“①”:带“*”标识的部件表明有两个或两个以上的码元。为减少篇幅,本表只取其一个码元。
五、词语编码输入方法
为提高汉字词语输入的准确率、自动上屏率,本发明设置了首字定向联想词语输入方法。
首字定向联想词语输入的编码为:W·a2a3a4…an其中:
“W”:词语的第一个汉字(首字);
“·”:点击“F11键(或F12或Shift键)”;
“a2a3a4…an”为词语的第二个、第三个至最后一个汉字的音码组合;
输入词语的第二个汉字的音码“a2”,则完成两字词语的输入,
顺序输入词语的第二个至最后一个汉字的音码“a2”至“an”,则完成多字词语的输入。
如输入以“马”字为首字的两字词语“马赫”,其操作步骤如下:
①输入首字“马”;
②点击“F1键(或F12键或Shift键)”;
③输入“赫”字的音码“h”后,此时,视屏给出:
“1.马号 2.马虎 3.马赫”
④点击数字键“3”,即完成两字词语“马赫”的输入。
如输入词语“”,其操作步骤如下:
①输入首字“马”;
②点击“F1键(或F12键或Shift键)”;
③顺序输入“首是瞻”的音码“ssz”,即完成词语“”的输入。
本发明的首字定向联想词语输入方法,实质是用户输入词语的首字后,再顺序输入词语的第二个、第三个至最后一个汉字的音码“a2a3…an”,系统即按词语的第二个至最后一个汉字的音码的序列,搜索编码为“首字·a2a3a4…an”的词语,当搜索到的词语是唯一的,词语便自动上屏;若有多个编码为“首字·a2a3a4…an”相同的词语时,系统即按汉字的音码的序列给出所有的词语。当输入到“首字·a2a3…ai…”时,如果这个词语是唯一的多字词语,这个多字词语便自动上屏,而不必继续顺序输入其他汉字的音码。如:
“中国人民解放军”的编码为“中·grmjfj”,但当输入到“中·grmj”时,“中国人民解放军”是唯一的多字词语,自动上屏,完成输入。无需再输入“fj”两个音码。
同理:“中国人民政治协商会议”的编码为“中·grmzzxshy”,当输入到“中·grmz”时,“中国人民政治协商会议”自动上屏,完成输入,不必再输入“治协商会议”等字的音码“zxshy”。
首字定向联想词语编码输入的实例见表4
表4.首字定向联想词语编码及实际输入的范例
注:1*:可用输入空格键代替数字键1进行词语选择,下同;3*:表明要输入数字键3进行键选,下同;
f*:表明“宽泛”自动上屏,下同;dh*:表明输入“dh”后,“宽大豁亮”自动上屏,下同;
**:此时,键入空格键可完成“宽银幕”的输入,再输入空格键即可完成“宽银幕电影”的输入。
六、符号编码输入方法
(一)符号名称
本发明将符号分为字母类符号和非字母类符号两大类。
字母类符号有131个,其中:
1.汉语拼音声调符31个,具有传统的名称。其传统名称为汉语拼音声调符的名称。如:
“ā”:阿一声;“á”:阿二声;“ǎ”:阿三声;“à”:阿四声;“α”:阿轻声;
“ē”:厄一声;“é”:厄二声;“ě”:厄三声;“è”:厄四声;
“ī”:衣一声;“í”:衣二声;“ǐ”:衣三声;“ì”:衣四声;
“ō”:喔一声;“ó”:喔二声;“ǒ”:喔三声;“ò”:喔四声;
“ū”:乌一声;“ú”:乌二声;“ǔ”:乌三声;“ì”:乌四声;
“ǖ”:迂一声;“ǘ”:迂二声;“ǚ”:迂三声;“ǜ”:迂四声;“ü”:迂轻声;
……
2.希腊字母48个,具有传统的中文译音名称。其中文译音为希腊字母的名称。如:
“α”:阿儿法;“β”;贝塔;“λ”:兰姆搭;“δ”:待儿塔;“π”:派;
“∑”:西格马;“ξ”:柯西;“Ω”:欧米咖;“ε”:艾普西隆;“ρ”:柔;
……
3.双字节大小写英文字母52个,本发明分别将其以大写、小写英文字母命名:
A(大写A);a(小写a);B(大写B);b(小写b);……Z(大写Z);z(小写z)。
非字母类符号有209个:
1.中文标点符号43个,具有传统的名称,其传统名称为中文标点符号的名称。如:
……(省略号);《》(书名号);?(问号);〔〕(六角括号);‘’(单引号);§(章节号);々(同上符);·(间隔号);:(冒号);……
2.数理符号74个,具有传统的名称,其传统名称为数理符号的名称。如:
“⊙”:圆;“∠”:角;“◇”:棱形;“△”:三角形;“◎”:同心圆;
“∩”:交;“∨”:或;“log”:对数;“≈”:约等于;“∥”:平行于;
“⊥”:垂直于;“≠”:不等于;≯”:不大于;“∵”:因为;“∴”:所以;
“≥”:大于等于;“∫”:积分符;“f”:函数符;“∮”:环积分;
……
3.罗马数字22个,具有传统的名称,其传统名称为罗马数字的名称。如:
I(罗马一);II[罗马二];V(罗马五);VIII(罗马八)……
4.特定符号61个,具有特定的名称,特定名称为特定符号的名称。如:
℃(摄氏度);°F(华氏度);pH(PH值);¥(人民币、货币符);$(美元);%(百分号);‰(千分号);♀(雌性符);(圈正);☆(五星)……
5.双字节阿拉伯数字10个,本发明分别将其命名为:
0(阿零);1(阿一);2(阿二);3(阿三);4(阿四);
5(阿五);6(阿六);7(阿七);8(阿八);9(阿九)。
6.双字节数字序号60个,本发明将其全部命名,如:
1.(一点);2.(二点);3.(三点);……18.(十八点);19.(十九点);20.(二十点);
(1)(括号一);(2)(括号二);(3)(括号三);……(19)(括号十九);(20)(括号二十);
㈠[括号一];㈡(括号二);㈢(括号三);……㈨(括号九);㈩(括号十);
①[圈一];②(圈二);③(圈三);……⑩(圈十)。
7.有些符号在不同的领域或学科有不同的名称,如:
“∑”有“西格马”、“和”、“积和”三个名称;
“@”有“圈a”、“单价符”两个名称;
“¥”有“人民币”、“货币符”两个名称。
(二)符号编码输入方法
与本发明的非成字基本部件的编码方法一样,本发明以符号名称的汉字的音码组合为符号的编码。
1.符号的三键形码编码输入方法:
顺序取符号名称前三个汉字的音码组合为符号的三键形码编码。
名称不足三个汉字的字母类符号,用字母“e”补足三键,为字母类符号的三键形码;
名称不足三个汉字的非字母类符号,用字母“a”补足三键,为非字母类符号的三键形码。如:
字母类符号的三键形码编码:
ā(阿一声)编码为[ays];á(阿二声)编码为[aes];ǎ(阿三声)编码为[ass];
à(阿四声)编码为[ass];α(阿轻声)编码为[aqs];
π(派)编码为[pee];α(阿儿法)编码为[aef];β(贝塔)编码为[bte];
γ(咖马)编码为[gme];∑(西格马)编码为[xgm];ε(艾普西隆)编码为[apx];……
非字母类符号的三键形码编码:
∠(角)编码为[jaa];⊙(圆)编码[yaa];%(百分号)编码为[bfh];
①(圈一)编码为[qya];?(问号)编码为[wha];≥(大于等于)为[dyd];……
2.符号的四键形码编码输入方法
顺序取符号名称前四个汉字的音码组合为符号的四键形码编码。
名称不足四个汉字的字母类符号,用字母“e”补足四键,为字母类符号的四键形码。
名称不足四个汉字的非字母类符号,用字母“a”补足四键,为非字母类符号的四键形码。如:
字母类符号的四键形码编码:
ā(阿一声)编码为[ayse];á(阿二声)编码为[aese];ǎ(阿三声)编码为[asse];
à(阿四声)编码为[asse];a(阿轻声)编码为[aqse];……
π(派)编码为[peee];α(阿儿法)编码为[aefe];β(贝塔)编码为[btee];
γ(咖马)编码为[gmee];∑(西格马)编码为[xgme];ε(艾普西隆)编码为[apxl];……
非字母类符号的四键形码编码:
∠(角)编码为[jaaa];⊙(圆)编码为[yaaa];%(百分号)编码为[bfha];
①(圈一)编码为[qyaa];?(问号)编码为[whaa];≥(大于等于)编码为[dydy];……
本发明对GBK字符集中的350个字母类符号和非字母类符号进行了编码。为节约发明专利说明书的篇幅,仅在附表4中列出部分字母类符号和非字母类符号的编码实例。
七、功能设置
本发明设置了字词跟踪查询检索功能、汉字字音查询检索功能、字音查询检索汉字功能、汉字层次解析编码查询检索功能、汉字动态摹写功能、汉字默写功能、用户自定义词语功能、词语释义查询检索功能。
为便于系统的输入状态的切换,在位于视屏左下方的输入状态显示栏中设置了“ZY(字音)”、“JB(解编)”、“ZC(字词)”、“SX(书写)”四个对话框。其中:
“ZY”:汉字字音查询检索和由字音(或模糊字音)查询检索汉字对话框;
“JB”:查询检索汉字的层次解析编码对话框;
“ZC”:查询检索词语,自定义词语,词语释义对话框;
“SX”:汉字动态摹写和汉字默写对话框。
(一)字词跟踪查询检索功能
本发明设置了字词跟踪查询检索功能,即输入一个汉字后,所有以该字为首字的词语则按其第二个汉字的音码“a→z”的序列,顺序分屏跟随。用户可直接用相应的数字键选择或翻屏键选所需的词语。
如,输入完“歧”字后,以“歧”字为首字的词语则按其第二个汉字的音序顺序排列, 分屏跟随待选:
“1.歧出 2.歧化 3.歧视 4.歧见 5.歧路 6.歧路亡羊 7.歧义、8.歧异”
此时:点击数字键“8”即可完成词语“歧异”的输入;
点击数字键“6”即可完成词语“歧路亡羊”的输入。
如果完成词语首字的输入后,所需的词语不在首屏出现,可用“=”键或“PgDn”键翻屏查完成所需词语的输入。如输入词语“”,完成首字“马”的输入后,首屏给出:“1.马鞍 2.马鞍山 3.马鞍子 4.马帮 5.马弁 6.马鞭 7.马表 8.马不停蹄 9.马不歇鞍 0.马刺”
没有词语“”,用“=”键或“PgDn”键翻屏即可到:
“1.马赫……7.马术 8. 9.马失前蹄……”
点击数字键“8”即完成词语“”的输入。
对于由多个词语组成的复合词语或特定词语,本发明设置了字词连续跟踪功能。输入复合词语或特定词语的前两个汉字后,所有以这两个汉字开头的复合词语或特定词语则按其第三个汉字的音码“a→z”的序列,顺序分屏跟随待选。如,完成词语“中国”的输入后,以“中国”为前两个汉字的特定词语则按第三个汉字的音码序列顺序列出:
“1.中国共产党、2.中国人民银行、3.中国人民解放军、4.中国政府……”即跟踪显示在视屏上待选。此时,点击空格键或数字键“1”,即完成“中国共产党”的输入,点击“数字键“3”,即完成“中国人民解放军”的输入。
(二)汉字动态摹写功能
为满足汉字书写教学的需求和用户对汉字的书写练习,本发明设置了汉字动态摹写功能。为实施汉字的动态摹写,本发明应用造字程序造出了3500个常用字的基本部件书写组合体,建立了汉字动态摹写数据库hzdtmxsjk。
汉字动态摹写的操作方法和步骤如下:
1.输入或选中被摹写的汉字;
2.用鼠标左键点击屏幕左下方的输入状态栏中的“SX”框,即由汉字输入状态切换到汉字动态摹写状态;
3.顺序输入被摹写汉字的基本部件的码元,系统即顺序演绎被摹写汉字的基本部件及基本部件动态组合成字的过程;
4.完成上述三步操作后,用户可根据提示,选择退出汉字动态摹写状态,也可选择全部或部分摹写的信息。
如,要演绎“我”字的动态摹写,其操作步骤如下:
1.输入或选中“我”字;
2.点击屏幕左下方的输入状态栏中的“SX”框,屏幕给出汉字动态摹写框:
3.1输入“我”字的第一个基本部件“丿”的码元“p”后,视屏给出:
3.2继续输入“我”字的第二个基本部件“一”的码元“h”后,视屏给出:
3.3继续输入“我”字的第三个基本部件“亅”的码元“g”后,视屏给出:
……,直至输入“我”字的最后一个基本部件“丶”的码元“d”,视屏给出:
4.此时:
键入“N”即退出汉字动态摹写状态;
若要检索出“我”字的动态摹写的全部信息,键入“Y”或用鼠标点击“Y”,即检索出:
“我[wǒ]phghzpd 丿一亅丿丶 我”
若要检索出“我”字的动态摹写的部件组合信息,如选中“丿一亅丿丶我”后,键入“Y”或用鼠标点击“Y”,即检索出“丿一亅丿丶 我”。
又如,输入并选中“兼”字后,屏幕给出:
顺序输入“兼”字的基本部件“丷一丨丨ハ”的码元“d、h、z、l、b”,系统即顺序演绎基本部件“丷一丨丨ハ”及组合成“兼”字的动态书写过程:
同样,可检索出“兼”字的动态摹写的全部或部分信息。
需要指出的是,不同的用户对同一个汉字的基本部件的认知不同,如“藏”字,有的用户认定“藏”是顺序书写基本部件“艹厂丆臣丿丶”而成,有的认定是顺序书写基本部件“艹一爿臣丿丶”而成。据此,本发明设置了汉字由不同的基本部件组合而成的动态摹写。如,“藏”是由基本部件“艹厂厂臣丿丶”组合而成的动态摹写为:
“藏”是由基本部件“艹一片臣丿丶”组合而成的动态摹写为:
又如,有的用户认为“垂”字是“独体字”,只能解析为基本笔画。即“垂”只能是顺序书写“丿一丨一丨丨一一”基本笔画的组合“垂”;而有的用户认定“垂”字是顺序书写“千一丨丨一一”基本部件的组合“垂”;还有的用户认为“垂”字是顺序书写“千艹一一”基本部件的组合“垂”。据此,“垂”字有如下三种由不同的基本部件组合而成的动态摹写:
(三)汉字默写功能
为实施汉字默写功能,本发明对GBK字符集中的简体汉字,建立了应用汉字基本部件的汉字默写数据库hzmxs jk。
汉字默写的方法和操作步骤如下:
1.用鼠标点击屏幕左下方的输入状态栏中的“SX”框,由汉字输入状态切换到汉字默写状态,屏幕给出汉字默写框:
2.顺序输入被默写汉字的基本部件的码元;
3.点击“End”键,结束汉字默写;
此时,如果被默写的汉字是唯一的,系统即给出被默写汉字的字音、顺序输入的码元及其与之相对应的基本部件、被默写的汉字等信息。
如果被默写的汉字是重码字,用户可用数字键选择被默写的汉字,选定后,系统即给出被默写汉字的字音、码元及其与之相对应的基本部件等全部信息;
4.若要检索被默写汉字的全部信息,可键入或用鼠标点击“Y”,检索出全部被默写汉字的字音、顺序输入的码元及与之相对应的基本部件等信息;选中被默写汉字的部分信息,键入或用鼠标点击“Y”,即可检索出被选中的信息;键入“N”退出汉字的默写状态,返回汉字输入状态,
如:要默写“弊”字:
1.用鼠标点击屏幕左下方的输入状态栏中的“SX”框,屏幕显示:
2.顺序输入“弊”字的基本部件的码元“dtspdfg”,屏幕显示:
3.点击“End”,屏幕显示:
4.此时:
若键入或用鼠标点击“Y”,即检索出“弊[bì]dtspdfg丷冂丨丿丶攵廾弊”信息;
若选中“丷冂丨丿丶攵廾弊”,键入或用鼠标点击“Y”,即检索出“丷冂丨丿丶攵廾弊”;
若键入或用鼠标点击“N”,则退出汉字的默写状态,返回汉字输入状态。
如,默写“蔼”字,按上述操作步骤,完成“cyrbrz”,点击“Eed”键,屏幕显示:
如,默写“羯”字,按上述操作步骤,完成“yrbrz”,点击“End”键,屏幕显示:
此时,键入数字“2”,选中“羯”字,屏幕显示:
至此,用户可进行“羯”字的默写的相关信息检索或退出。
同理,默写“醭”字,按上述操作步骤,完成“yydspn”,点击“End”键,屏幕显示:
此时,键入数字“1”,选中“醭”,屏幕显示:
至此,用户可进行“醭”字的默写的相关信息检索或退出。
(四)汉字字音查询检索功能
为提高用户对汉字的认知能力,本发明设置了汉字字音查询检索功能。其操作方法和步骤为:
①用鼠标选中被查字;
②用鼠标点击屏幕左下方输入状态栏中的“ZY”框。系统即给出被查汉字的字音。
如:选中“堃”字,则屏幕给出“堃”字的字音:
此时,键入“y”,即检索出“堃[kūn]”;键入“n”,则退出汉字字音查询检索状态返回汉字输入状态。
若选中“夔”字,则屏幕给出“夔”字的字音:
此时,键入“y”,即检索出“夔[kuí]”;键入“n”,则退出汉字字音查询检索状态返回汉字输入状态。
(五)由字音查询检索汉字功能
为解决用户对“只知字音而不知字形”汉字的输入问题,本发明设置了由字音查询检索汉字功能、由汉字模糊字音(不带声调符的汉字字音)查询检索汉字功能。
1.由字音查询检索汉字的方法
其操作方法和步骤如下:
①输入并选中被查询汉字的字音;
②用鼠标点击屏幕左下方的输入状态栏中的“ZY”框,系统即分屏给出所有字音相同的汉字,用户可点击数字键或翻屏键选所需汉字。
如,只知道“缘”字的字音“yuán”,忘记了“缘”字的字形,则:
①输入并选中“缘”的字音“yuán”;
②用鼠标点击屏幕左下方的输入状态栏中的“ZY”框,系统即分屏给出字音为“yuán”的所有汉字,待用户查询检索:
“1.元 2.芫 3.园 4.员 5.沅 6.垣 7.爰 8.袁 9.原 0.圆”
第一屏无“缘”字,用“=”键或“PgDn”键翻屏查到:
“1.鼋 2.援 3.湲 4.媛 5.缘 6.塬 7.猿 8.源 9.嫄 0.辕”。
此时,点击数字键“5”,即完成“缘”字的查询检索输入。
又如,只知道“揆”字的字音[kuí],忘记了“揆”字的字形,则:
①输入并选中“揆”的字音“kuí”;
②用鼠标点击屏幕左下方输入状态栏中的“ZY”框,系统即分屏给出字音为“kuí”的所有汉字,待用户查询检索:
翻屏到:
“1.奎 2.逵 3.馗 4.隗 5.揆 6.葵 7.喹 8.骙 9.暌 0.魁”
点击数字键“5”即完成“揆”字的查询检索输入。
2.由汉字的模糊字音查询检索汉字的方法
其操作方法和步骤如下:
①输入并选中被查询汉字的模糊字音;
②用鼠标点击屏幕左下方汉字输入状态栏的“ZY”框,系统即分屏给出所有模糊字音相同的汉字,待用户查询检索。
如,输入并选中“缘”字的汉语拼音字母集合“yuan”,需要翻屏3次到:
“1.援 2.湲 3.嫒 4.缘 5.塬 6.猿 7.源 8.嫄 9.辕 0.橼”
此时,点击数字键“4”完成“缘”字的查询检索输入。
同理,忘记了“葺[qì]”字的字形,输入并选中其模糊字音“qi”,点击屏幕左下方输入状态栏的“ZY”框后,需要翻屏9次到:
“1.泣 2.亟 3.契 4.砌 5.葺 6.碛 7.碶……”
点击数字键“5”,完成“葺”字的查询检索输入。
(六)汉字层次解析编码查询检索功能
为使汉字层次解析编码应用于汉字识字教学,使用户掌握汉字不同层次的结构特征,提高对汉字的认知能力。本发明设置了“汉字层次解析编码查询检索”功能。其操作步骤如下:
①选中被查汉字;
②用鼠标点击屏幕左下方输入状态栏中的“JB”框。系统即给出被查汉字的字音、层次解析、不同层次的形码、形音码、音形码汉字编码及其部件名称等信息。
如用户当前采用的是本发明的四键形码输入方法,分别选中“重、秉、窗、御、缘”等字,分别点击屏幕左下方输入状态栏中的“JB”框,系统即分别给出“重、秉、窗、御、缘”等字的字音、层次解析及全息部件形码和不同层次的四键形码的编码等信息:
如用户当前采用的是本发明的四键形音码输入方法,分别选中“重、秉、窗、御、缘”等字,分别点击屏幕左下方输入状态栏中的“JB”框,系统即分别给出“重、秉、窗、御、缘”等字的字音、层次解析及全息部件形码和不同层次的四键形音码的编码等信息:
如用户当前采用的是本发明的四键音形码输入方法,分别选中“重、秉、窗、御、缘”等字,分别点击屏幕左下方输入状态栏中的“JB”框,系统即分别给出“重、秉、窗、御、缘”等字的字音、层次解析及全息部件形码和不同层次的四键音形码的编码等信息:
(七)用户自定义词语建立功能
不同职业、不同专业的用户都有与自己专业密切相关的专用词语,为使这些用户能准确、快捷地输入专用词语,本发明设置了用户自定义词语建立功能。其建立方法和操作步骤:
①输入并复制(或在当前文本中复制)所需建立的自定义词语“W1W2W3……Wn”;
②用鼠标点击屏幕左下方输入状态栏中的“ZC”框,屏幕显示:
其中:
自定义词语:W1W2W3……Wn:是输入并选定的自定义词语。其中:
W1为词语首字;W2为词语的第二个汉字,……Wn为词语最后一个汉字;
如果系统中已有用户输入并选中的词语,系统则给出“已有词语W1W2W3……Wn”。此时,用户可点击“N键”退出建立用户自定义词语状态。返回汉字输入状态。
编码:“a2a3…an”:是需要用户输入的自建词语的第二个至最后一个汉字的音码。用户可顺序输入词语“W1W2W3……Wn”的第二个汉字“W2”的音码“a2”至最后一个汉字“Wn”的音码“an”,点击“y”确定,即完成用户自定义词语的建立。
如,用户要建立专用词语“壳幔结构”,输入并选定“壳幔结构”,用鼠标点击屏幕左下方输入状态栏中的“ZC”框,屏幕显示:
此时,顺序输入“壳幔结构”的第二个、第三个和最后一个汉字“幔结构”的音码“mjg”,屏幕显示:
此时,点击“Y”即完成自定义词语“壳幔结构”的建立。系统返回汉字输入状态;点击“N”,放弃自定义词语的建立,系统返回汉字输入状态。
(八)词语释义查询检索功能
汉字识字教学中,需要准确、简捷、快速调用词语、成语解释。用户在阅读电子文本时,往往也要查询相关词语。为此,本发明设置了词语释义查询检索功能。
其操作方法和步骤如下:
1.输入并选中(或在文本中选中)需要查询检索的词语;
2.用鼠标点击屏幕左下方输入状态栏中的“ZC”框,系统即给出选中的词语释义。
如,输入并选中或在文本中选中“刚愎”并点击“ZC”框,屏幕即显示出词语“刚愎”的释义:
如,输入并选中或在文本中选中“刚愎自用”并点击“ZC”框,屏幕即显示出词语“刚愎自用”的释义:
又如,选中成语“纷至沓来”并点击“ZC”框,屏幕即显示出词语“纷至沓来”的释义:
第五部分 本发明的创新性和实用性综合陈述
一汉字层次解析编码的创新性陈述
检索表明,没有一种汉字形码编码输入方法与本发明的汉字层次解析编码输入方法相同或类似。因此,本发明的汉字层次解析编码输入方法属国内首创。
(一)本发明的汉字层次解析编码保持了绝大多数汉字的完整的部件信息,体现了汉字结构的整体性,揭示了汉字的文化内函,符合中国人对汉字的认知理念:
1.本发明的汉字层次解析编码体现了汉字的两分结构特征,符合“整体识字”的汉字识字教学规范,符合中国人对汉字的整体认知理念
在《现代汉语规范字典》中的9035个汉字中,有8488个汉字具有“两分结构特征”,可以直接解析成两个部件。根据本发明的汉字层次解析编码方法,具有“两分结构特征”的汉字在第一个层次中解析为两个部件,充分体现了汉字的“两分结构特征”,符合中国人对汉字的整体认知理念,符合汉字识字教学的“整体识字”的教学规范。
仅以本发明的汉字四键形码编码方法为例,具有“两分结构特征”的汉字,在第一个层次中解析出两个部件,只有两个码元,以汉字的首笔画的码元和末笔画的码元,补足四键形码的第三个和第四个码元的编码方法,充分体现了汉字的两分结构的特征。
2.本发明的汉字层次解析编码充分体现了汉字形音结构特征,揭示了汉字的文化内涵
本发明人对汉字结构的研究表明,《现代汉语规范字典》中有80%以上的汉字是“两分形音结构特征”的形音字。根据本发明的汉字层次解析编码方法,具有“两分形音结构特征”的汉字在第一个层次中解析出两个部件,一个是传统的“表义部件”,另一个是“表音部件”起表“声、韵、调”或表“声、韵”或表“韵、调”或只表“韵”的作用。本发明的汉字层 次解析编码输入方法,充分体现了汉字形音结构特征,揭示了汉字的文化内涵。
仅以本发明的汉字四键形码编码方法为例,具有“两分形音结构特征”的汉字,在第一个层次中解析出一个“表义部件”和一个“表音部件”两个部件,只有两个码元,以汉字的首笔画的码元和末笔画的码元,补足四键形码的第三个和第四个码元的编码方法,充分体现了形音字的特征。
如“客、胳、饹、格、鸽、袼、阁、骼、硌、铬、貉、茖……”等具有两分形音结构特征的汉字,第一个层次中解析出两个部件,其中的“各”是表音部件,表征了这些汉字的字音信息。其四键形码编码如下:
“客”编码为[bgdh];“胳”编码为[ygph];“饹”编码为[sgph];“格”编码为[mghh];
“鸽”编码为[gnph];“袼”编码为[ygdh];“阁”编码为[mgdh];“骼”编码为[ggsh];
“硌”编码为[sghh];“铬”编码为[jgph];“貉”编码为[zgph];“茖”编码为[cghh]。
又如“句”字有“jù、gōu”两个音,是多音字。在“佝、枸、苟、岣、狗、笱、雊、拘、泃、驹、跔”等汉字的四键形码编码中,取部件“句”的两个不同的音码编码,充分体现了形音字的特征:
“佝”有编码[rgph/rjph];“枸”有编码[mghh/mjhh];“岣”有编码[sgsh/sjsh];
“狗”有编码[qgph/qjph];“笱”有编码[zgph/zjph];“拘”有编码[tjhh/tghh];
“泃”有编码[sjdh/sgdh];“驹”有编码[mjzh/mgzh];“跔”有编码[zjsh/zgsh]。
3.本发明的汉字层次解析编码充分体现了汉字的形、音、义一体的文化内涵
根据本发明的汉字层次解析编码方法,具有两分形音结构特征的汉字,在第一个层次中解析出的两个部件,一个是“表音部件”,另一个是传统的“表义部件”。“表义部件”是汉字重要的字源理据,且具有很强的构字能力,必须保持表义部件的整体性。本发明的汉字层次解析编码输入方法,充分体现了汉字的形、音、义一体的文化内涵。
仅以本发明的汉字四键形码编码方法为例,具有“两分形音结构特征”的汉字,在第一个层次解析出一个“表义部件”和一个“表音部件”,只有两个码元,以汉字的首笔画的码元和末笔画的码元,补足四键形码的第三个和第四个码元的编码方法,充分体现了形音字的特征。
如:“客、胳、饹、格、鸽、袼、阁、骼、硌、铬、貉、茖……”等具有两分形音结构特征的汉字,第一个层次中解析为两个部件,其中的“宀、月、饣、、鸟、衤、门、骨、石、钅、豸、艹”是传统的表义部件,表征上述汉字的属性特征。其四键形码的编码如下:
“客”编码为[bgdh];“胳”编码为[ygph];“饹”编码为[sgph];“格”编码为[mghh];
“鸽”编码为[gnph];“袼”编码为[ygdh];“阁”编码为[mgdh];“骼”编码为[ggsh];
“硌”编码为[sghh];“铬”编码为[jgph];“貉”编码为[zgph];“茖”编码为[cghh]。
(二)本发明的汉字层次解析编码实现了“科学性、规范性、实用性相统一、汉字输入与汉字识字教学相统一”的目标,既满足了“与识渐进”的汉字识字教学需求,又使不同的用户都能根据自己对汉字的认知能力,建立自己的认知输入体系
汉字识字教学是一个与识渐进的过程,并不是先学会了“俞”字,再学“输、愉、偷、 喻、逾、渝、瑜、榆”等字;
不同文化背景的用户对汉字和汉字部件的认知能力不同。
绝大多数具有两分结构特征的汉字,在第一个层次解析出的成字部件是多层次结构的汉字,且有许多是非常用字、生僻字,只有对这些部件继续进行解析,才具有实际应用价值。
由于本发明对汉字实施了不同层次的解析编码,使非常用字、生僻字部件进行二次、三次甚至四次解析,使识字阶段的小学生、不同文化背景的用户,都能选择自己所认知的基本部件的汉字编码输入汉字。
由非常用字、生僻字部件构建的汉字的层次解析及全息部件形码、三键形码、四键形码编码范例见表5。
表5.非常用字、生僻字部件构建的汉字的层次解析及编码范例
注:带“*”的汉字部件是多音字部件,为表征简捷,表中只取其一个字音的码元。
(三)本发明的汉字层次解析编码和汉字字音查询检索功能、字音查询检索汉字输入功能、汉字层次解析编码查询检索功能、汉字动态摹写功能和汉字默写功能,解决了汉字电化教学实时讲授汉字结构、演绎汉字书写的难题。本发明既是一种汉字层次解析编码输入方法,又是一种汉字识字教学的方法
由于本发明选用的45个笔画基本部件、201组汉字部首及其56个部首的变形体基本部件、75个笔画组合体基本部件都是汉字识字教学必不可少的。可是其中的许多笔画、部首的变形体、笔画组合体在GB13000.1字符集中没有。更没有本发明的汉字的部件书写组合体。
本发明应用造字程序构建了一个完整的汉字基本部件集,而且对每个汉字基本部件都实施了编码,存储在GB13000.1字符集中相应字符区位代码地址中。本发明还建立了3500个常用字的动态摹写数据库hzdtmxsjk和对GBK字符集中的简体汉字,建立了应用汉字基本部件的汉字默写数据库hzmxsjk。所有这些在用户安装本发明的输入软件时,便自动安装在使用的字符集中。因此,在汉字识字教学中,应用本发明的汉字层次解析编码方法和汉字字音查询检索功能、字音查询检索汉字输入功能、汉字层次解析编码查询检索功能、汉字动态摹写功能和汉字默写功能,完全可以取代传统的板书,实施边讲、边演绎汉字的结构、汉字的动态书写过程。因此,可以说,本发明设计的上述功能,是对汉字识字教学的“创新性贡献”。
学生和用户通过查询检索和阅读汉字的层次解析,就是一个学习汉字或巩固、提高汉字的认知能力的过程。如:
在汉字识字教学中,应用本发明的“汉字动态摹写功能”实施汉字的书写教学,实时讲授和演绎汉字的书写规范,学生和用户用此功能,进行汉字的书写练习,提高对汉字的书写能力,克服“电脑失写症”。如:
此外,在汉字识字教学中,教师应用本发明的“汉字默写功能”测试学生对汉字的认知 能力,学生可用此功能测试、提高自己对汉字的认知能力和书写能力。
由以上实例可知,如果没有不同形态的完整的汉字的基本部件、基本部件的编码、3500个常用字的动态摹写数据库hzdtmxsjk和对GBK字符集中的简体汉字,建立的应用汉字基本部件的汉字默写数据库hzmxsjk,就无法真正应用计算机实施汉字的电化教学。
二词语编码输入的创新性及实用性陈述
检索表明,没有一种汉字编码输入方法,采用了本发明词语编码输入方法。
虽然,本发明收录的词语多达11万余条,但统计表明,使用本发明的“首字定向联想词语输入方法”输入词语,准确率100%;两字词语无键选上屏和一次键选(无翻屏键选)上屏的词语高达98%;有95%以上的多字词语只需顺序输入词语的第二个、第三个两个汉字的音码,即可无键选完成多字词语的输入;四个或四个以上汉字的多字词语,顺序输入词语的第二个至最后一个汉字的音码,99.4%的多字词语无键选上屏。
三符号编码输入的创新性及实用性陈述
本发明对GBK字符集中的350个字母类符号和非字母类符号进行了编码,其中包括:汉语拼音声调符,希腊字母,双字节大小英文字母,中文标点符号,数理符号,罗马数字,特定符号,双字节阿拉伯数字,双字节数字序号。
本发明以符号名称的汉字音码的组合为符号的编码,350个字母类符号和非字母类符号具有三键形码和四键形码编码。
检索表明,没有任何一种汉字输入方法的符号输入与本发明的符号编码方法相同。如:
对于“句号”、“逗号、“顿号”、“问号”、“分号”、“书名号”、“引号”、“单引号”、“冒号”、“!”、“波浪号”、“破折号”、“省略号”,“间隔号”、“等号”、“加号”、“减号”“百分号”的输入,各种汉字输入方法都是将其置于“全角输入”状态,直接点击键盘相应的键位或同时按下功能转换键“Shift”和相应的键位方式,来完成上述符号的输入。如:
点击“,”键完成“,”输入;同时按下“Shift”和“<”键完成“《”输入;
点击“.”键完成“。”输入,同时按下“Shift”和“>”键完成“》”输入;
点击“;”键完成“;”输入;同时按下“Shift”和“:”键完成“:”输入。
这种符号输入方法有如下缺陷:
1.输入的符号是有限的,绝大多数符号还是要通过其他方法来输入;
2.用户要不断地进行“全角、半角”输入状态的转换;
3.输入上述符号时,用户要同时按下“Shift”键和目标键,才能完成输入。
而本发明的符号编码输入方法,解决了符号的实时输入的难题。是一种简单、快捷的符号输入方法。以本发明的符号四键形码编码输入方法为例说明:
“。”编码为[jhaa];“,”编码为[dhaa];“、”编码为[dhaa];“?”编码为[whaa];
“;”编码为[fhaa];“《》”编码为[smha];““””编码为[yhaa];“‘’”编码为[dyha];
“:”编码为[mhaa];“!”编码为[jtha];“~”编码为[blaa];“——”编码为[pzha];
“……”编码为[slha];“·”编码为[jgha];“=”编码为[dhaa];“+”编码为[jhaa];
“-”编码为[jhaa];“%”编码为[bfha];……
因上述符号是常用符号,本发明对常用符号设置了“一键、两键、三键”简码字符,如:
点击“j”即完成“。”的输入;点击“d”即完成“,”的输入;
点击“wh”即完成“?”的输入;点击“dh”即完成“、”的输入;
点击“mha”即完成“:”的输入;点击“slh”即完成“……”的输入;
点击“yh”即完成““”的输入;点击“yha”即完成“””的输入;
点击“sm”即完成“《”的输入;点击“smh”即完成“》”的输入;……
本发明的数理符号的四键形码编码,教学时教师能实时讲授和演绎数学、物理。学生和科技工作者可以使用计算机简单、快捷、实时地解析数学物理习题、撰写科技论文,实时讲解和演绎学术报告。如:
“△(三角形)”的编码为[sjxa];“∠(角)”的编码为[jaaa];
“⊥(垂直于)”的编码为[czya];“°(度)”的编码为[daaa];
“∵(因为)”的编码为[ywaa];“′(分)”的编码为[faaa];
“∴(所以)”的编码为[syaa];“″(秒)”的编码为[maaa];
“+(加号)”的编码为[jhaa];“-(减号)”编码为[jhaa]。
教师完全可以实时(同声、同步——即边讲边输入)讲授和演绎如下数学题,学生也可自如地解答:
在△ABC中,AC⊥BC,∠A=32°45′26″,求∠B=?
解:∵∠A+∠B+∠C=180度(三角形内角和等于180°)
又∵AC⊥BC(已知)
∴∠C=90°
∴∠B=180°-(∠A+∠C)
=180°-(32°45′26″+90°)
=180°-122°45′26″
=57°14′34″
解毕。
综上所述,本发明以汉字编码必须符合汉字识字教学规范,符合中国人对汉字的认知理念为宗旨;以汉字的书写规范为准则,对汉字实施层次解析编码的技术方法,实现了汉字编码输入的科学性、规范性、实用性相统一;汉字输入与汉字识字教学相统一;实现了汉字的键盘书写的目标。
附表
附表1.笔画基本部件、区位码、名称、归部、码元、三键形码、四键形码及构字实例一览表
附表2.56个成字部首的变形体基本部件及其名称、区位码、三键形码、四键形码一览表
附表3.75个非成字基本部件、区位码、名称、三键形码、四键形码及构字实例一览表
注:“*”:“”的第二笔是“复折”。为简化笔画基本部件名称,“复折”简称为“复”。
附表4.部分字母类符号和非字母类符号的编码实例
本文发布于:2024-09-23 18:17:01,感谢您对本站的认可!
本文链接:https://www.17tex.com/tex/2/74249.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |