一种生僻字发音提醒方法、装置及计算机设备与流程



1.本发明涉及人工智能技术领域,更具体地说,涉及一种生僻字发音提醒方法、装置及计算机设备。


背景技术:



2.在校学习或者自我学习过程中,人们往往需要对文章或者某一段落进行朗读。在朗读过程中,如果遇到生僻字,则需停下来通过查字典或者上网查询该生僻字的读音才可继续朗读,该给朗读者的朗读带来不便。


技术实现要素:



3.本发明要解决的技术问题在于,提供一种改进的生僻字发音提醒方法、装置及计算机设备。
4.本发明解决其技术问题所采用的技术方案是:构造一种生僻字发音提醒方法,包括:
5.s10、显示朗读文本;
6.s20、接收朗读语音,识别所述朗读语音对应的文字,逐字跟踪所述朗读文本中的文字;
7.s30、当判断朗读参数满足停滞条件时,根据跟踪进度将待朗读的首个文字作为生僻字,并对所述生僻字进行发音提醒。
8.优选地,对所述生僻字进行发音提醒包括:以与所述生僻字同音的同音字对所述生僻字进行发音提醒;其中,所述同音字相对所述生僻字更为常用。
9.优选地,对所述生僻字进行发音提醒包括:以所述生僻字的拼音对所述生僻字进行发音提醒,和/或以语音的方式对所述生僻字进行发音提醒。
10.优选地,还包括:对各文字进行常用级别的划分,常用级别高的文字相对常用级别低的文字更为常用;将已划分常用级别的文字中的同音字进行分组,形成同音组库;或者,
11.将各文字中的同音字进行分组;对各组中的各文字进行常用级别的划分,常用级别高的文字相对常用级别低的文字更为常用,形成同音组库;
12.步骤s30中,以与所述生僻字同音的同音字对所述生僻字进行发音提醒;其中,所述同音字相对所述生僻字更为常用;包括:
13.在所述同音组库中检索与所述生僻字同组的同音字,并获取常用级别比所述生僻字高的同音字对所述生僻字进行发音提醒。
14.优选地,所述各文字包括:自行抽取样本文本,对所述样本文本进行单字切割统计,得到各文字;或者,获取输入法的第三方统计数据,得到各文字;
15.当各文字通过自行抽取样本文本得到时,对各文字进行常用级别的划分包括:根据各文字出现的次数对各文字进行常用级别的划分;
16.当各文字通过获取输入法的第三方统计数据得到时,对各文字进行常用级别的划
分包括:根据各文字的使用次数对各文字进行常用级别的划分。
17.优选地,获取常用级别比所述生僻字高的同音字对所述生僻字进行发音提醒,包括:
18.获取常用级别比所述生僻字高的多个同音字对所述生僻字进行间隔替换发音提醒;其中,多个同音字中,常用级别高的文字优先提醒。
19.优选地,还包括:接收试读语音,根据所述试读语音获取正常朗读状态下的正常时间间隔、正常朗读速度;
20.所述朗读参数为当前停滞时间,所述停滞条件为所述正常时间间隔;步骤s30中,当判断朗读参数满足停滞条件时,包括:当判断当前停滞时间大于所述正常时间间隔时;或者,
21.所述朗读参数为当前朗读速度,所述停滞条件为所述正常朗读速度;步骤s30中,当判断朗读参数满足停滞条件时,包括:当判断当前朗读速度小于所述正常朗读速度时。
22.优选地,以与所述生僻字同音的同音字对所述生僻字进行发音提醒的提醒方式包括:将所述同音字显示于所述生僻字的上方。
23.本发明还构造一种生僻字发音提醒装置,包括:
24.显示单元,用于显示朗读文本;
25.跟踪单元,用于接收朗读语音,识别所述朗读语音对应的文字,逐字跟踪所述朗读文本中的文字;
26.执行单元,用于当判断朗读参数满足停滞条件时,根据跟踪进度将待朗读的首个文字作为生僻字,并对所述生僻字进行发音提醒。
27.本发明还构造一种计算机设备,包括处理器和存储器,所述处理器通信连接所述存储器;
28.所述存储器用于存储计算机程序;
29.所述处理器用于执行存储器中存储的计算机程序以实现上述任一项所述生僻字发音提醒方法。
30.实施本发明的生僻字发音提醒方法、装置及计算机设备,具有以下有益效果:
31.当检测到朗读者在朗读过程中遇到生僻字时,可自动对该生僻字进行发音提醒,无须朗读者自行查询,从而提高朗读的连贯性及朗读效率。
附图说明
32.下面将结合附图及实施例对本发明作进一步说明,附图中:
33.图1是本发明的生僻字发音提醒方法的流程示意图;
34.图2是本发明的生僻字发音提醒装置的结构示意图。
具体实施方式
35.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
36.请参阅图1,图1是本发明的生僻字发音提醒方法的流程示意图,如图1所示,该生僻字发音提醒方法包括如下步骤:
37.步骤s10、显示朗读文本。
38.可以理解地,朗读文本为可供人们朗读的文本,朗读文本可以为文章、新闻等文档类读物,朗读文本可以包括文字内容、图表内容等内容。
39.步骤s10中,显示朗读者所需进行朗读的朗读文本,以供朗读者观看并根据朗读文本进行朗读、以及供朗读者观看生僻字的提醒。可以理解地,朗读文本可根据朗读者的选择确定进行显示。
40.步骤s20、接收朗读语音,识别朗读语音对应的文字,逐字跟踪朗读文本中的文字。
41.可以理解地,朗读文本中的文字内容由若干文字组成,当人们朗读该文字内容时,根据该文字内容的行文方向,逐个朗读文字内容中的文字。例如,从汉字的特点和人的生理习惯来看,文字内容的行文方向一般为从上至下,自左而右,本实施例以该种行文方向为例进行说明。当然,一些文字内容的行文方向也可为从上至下,从左到右。
42.当朗读者对朗读文本进行朗读时,按照朗读文本的文字内容的行文方向,逐个朗读文字内容中的文字,即从上至下,自左而右逐一朗读文字。在朗读者朗读的过程中,接收朗读语音,识别朗读语音对应的文字,逐字跟踪朗读文本中的文字。具体地,接收朗读语音,可采用语音转换成文字的技术,识别出朗读语音对应的文字,通过所识别出的文字与文字内容中的文字进行匹配,逐字跟踪朗读文本中的文字。
43.可以理解地,该跟踪的过程也可理解为,根据当前朗读者的朗读语速,即根据朗读语音转换成文字的情况,逐渐调整跟踪速度,并采用适应于朗读语速的速度按照文字内容的行文方向,逐个跟踪朗读文本中的文字,使得跟踪文字与朗读文字同步。可以理解地,语音转换成文字的技术可直接采用现有技术实现,现有的语音转换成文字的技术例如百度、讯飞等第三方语音转换成文字的技术。
44.当然,也可通过接收朗读者输入的调节指令,根据调节指令进行跟踪进度的调节。例如,调节指令可包括暂停、快进等,该调节指令可通过按键等实现。在一些实施场景中,光标位置与跟踪进度是保持一致的,因此,可通过改变光标的位置,来调节当前的跟踪进度。
45.其中,所跟踪的当前的文字可以用其它颜、其它字体或其它表现形式突出显示,以表示跟踪或朗读进度。
46.步骤s30、当判断朗读参数满足停滞条件时,根据跟踪进度将待朗读的首个文字作为生僻字,并对生僻字进行发音提醒。
47.可以理解地,当朗读者的朗读参数满足停滞条件时,认为朗读者出现停滞,同时停滞跟踪。
48.本实施例的生僻字发音提醒方法还包括:接收试读语音,根据试读语音获取正常朗读状态下的正常时间间隔、正常朗读速度。
49.可以理解地,朗读者在正式朗读之前,可先输入一段在正常朗读状态下的语音,作为试读语音。该试读语音可通过朗读者正常朗读一朗读文本的全部或部分内容实现输入;或者,通过播放朗读者在正常讲话状态下的讲话语音进行输入;或者,通过直接输入相应的语音,将朗读者输入的语音作为试读语音。可以理解地,此处所说的正常朗读、正常讲话皆为了可获取朗读者的正常语速,非处于停顿等状态下的语速。
50.接收试读语音,并且根据该试读语音获取朗读者在正常朗读状态下的正常时间间隔、正常朗读速度。可以理解地,可在朗读者的正常朗读或正常讲话过程中,计算朗读过程中两个文字之间的时间间隔,得到正常时间间隔。可在朗读者的正常朗读或正常讲话过程中,通过朗读者在额定时间内所完成朗读或讲话的额定文字字数,得到正常朗读速度。可以理解地,该正常时间间隔、正常朗读速度可为具体数值或数值区间。
51.步骤s30中,朗读参数可以为朗读的当前停滞时间,停滞条件则可以为正常时间间隔。可以理解地,当判断朗读参数满足停滞条件时,包括:当判断当前停滞时间大于正常时间间隔时,说明朗读者处于停滞状态,则认为朗读者遇到生僻字,并且按行文方向,将所跟踪的当前文字的后面的待朗读文字中的首个文字作为生僻字,并对该生僻字进行发音提醒。
52.或者,步骤s30中,朗读参数可以为当前朗读速度,停滞条件则可以为正常朗读速度。可以理解地,当判断朗读参数满足停滞条件时,包括:当判断当前朗读速度小于正常朗读速时,即当朗读者在额定时间内未能完成额定文字字数的朗读时,认为当前朗读速度小于正常朗读速度,说明朗读者处于停滞状态,则认为朗读者遇到生僻字,并对该生僻字进行发音提醒。
53.在本实施例中,对生僻字进行发音提醒的方式包括:以与生僻字同音的同音字对生僻字进行发音提醒;其中,同音字相对生僻字更为常用。
54.本实施例的生僻字发音提醒方法还包括:步骤s01、对各文字进行常用级别的划分,常用级别高的文字相对常用级别低的文字更为常用;将已划分常用级别的文字中的同音字进行分组,形成同音组库。
55.该步骤s01可在步骤s10之前。可以理解地,在朗读者进行朗读之前,先对各文字进行处理,使得可采用同音字对生僻字进行发音提醒。
56.该步骤中,各文字的获取包括:通过自行抽取样本文本,对样本文本中的文字内容进行单字切割统计,得到各文字;或者,获取输入法的第三方统计数据,得到各文字。
57.当各文字为通过自行抽取样本文本得到时,对各文字进行常用级别的划分包括:根据各文字出现的次数对各文字进行常用级别的划分。可以理解地,样本文本可以为新闻、文章等文档读物,并且可采用一个或多个样本文本,样本文本中的文字内容尽可能囊括较多文字,使得文字较为全面。
58.可以理解地,单字切割统计,例如文字内容包括“报抱暴豹古”等文字,则可切割为“报”、“抱”、“暴”、“豹”、“古”各文字,并统计各个文字出现的次数,例如,若“报”、“抱”、“暴”、“豹”、“古”分别出现了30次、20次、15次、8次、10次,则可采用常用级别来区分各文字的常用程度,此处出现次数较高的文字的常用级别相对出现次数较低的文字的常用级别更高。常用级别可以包括多个,例如常用级别包括常用级别1至常用级别10共10个常用级别,常用级别的数字越小代表常用级别越高。
59.当各文字通过获取输入法的第三方统计数据得到时,对各文字进行常用级别的划分包括:根据各文字的使用次数对各文字进行常用级别的划分。其中,输入法可以为搜狗、百度输入法,使用次数较高的常用级别相对使用次数较低的文字的常用级别更高。
60.完成各文字的常用级别划分后,将已划分常用级别的文字中的同音字进行分组,形成同音组库。可以理解地,同音字为拼音相同且语调相同。例如上述文字内容中的“报”、“抱”、“暴”、“豹”的读音皆为“b
à
o”,因此该多个文字为同音字,并且将该多个同音字分在一同音组中,因此该同音组中包括常用级分别为常用级别2、常用级别4、常用级别6、常用级别8的同音字“报”、“抱”、“暴”、“豹”,并可根据常用级别进行各同音字的排序。可以理解地,该同音组中各同音字的常用级别只是用于举例说明,并不代表实际的常用级别。多个同音组如此设置,组成同音组库。
61.在一些实施例中,步骤s01可以为:将各文字中的同音字进行分组;对各组中的各文字进行常用级别的划分,常用级别高的文字相对常用级别低的文字更为常用,形成同音组库。
62.可以理解地,该一些实施例中的步骤s01与本实施例中的s01的区别在于,在本实施例中,先完成各文字的常用级别划分,再将已划分常用级别的文字中的同音字进行分组。而一些实施例中,则是先对各文字中的同音字进行分组,再对各组中的各文字进行常用级别的划分。可以理解地,两者仅是执行的顺序不同。在本发明中,不对该两步骤的执行顺序进行限制,只要能实现在同音组库中形成各同音字组,且各同音组中的各文字皆有对应的常用级别即可,当然,各同音字组中的文字可按常用级别进行排序。
63.在步骤s30中,以与生僻字同音的同音字对生僻字进行发音提醒;其中,同音字相对生僻字更为常用。具体为,当识别出生僻字时,在同音组库中检索出与该生僻字同组的同音字,并获取常用级别比生僻字高的同音字对生僻字进行发音提醒。
64.进一步地,获取常用级别比生僻字高的同音字对生僻字进行发音提醒,包括:获取常用级别比生僻字高的多个同音字对生僻字进行间隔替换发音提醒;其中,多个同音字中,常用级别高的文字优先提醒。
65.具体地,通过在同音组库中检索出常用级别比生僻字高的所有同音字,并且获取常用级别较高的几个同音字,例如获取常用级别最高的三个同音字,对生僻字进行间隔替换发音提醒。
66.当然,也可以以其它数量的同音字进行替换提醒,例如当常用级别比生僻字高的同音字多于三个时,该多个同音字间隔替换,或者以常用级别较高的前几个同音字进行间隔替换;当常用级别比生僻字高的同音字小于三个时,以全部的同音字进行间隔替换。
67.该间隔替换发音提醒的方式包括:三个同音字定时间隔替换,例如,当所识别出来的生僻字为“豹”,则在同音组库中检索,检索出文字“豹”所在的同音组“报”、“抱”、“暴”、“豹”。在该同音组中,文字“报”、“抱”、“暴”比文字“豹”的常用级别高,因此,可以“报”、“抱”、“暴”轮流替换进行发音提醒。
68.例如,先以常用级别最高的同音字“报”进行发音提醒,自以“报”提醒时开始算起,当达到所设定的定时时间后,再以常用级别次之的同音字“抱”进行发音提醒;自以“抱”提醒时开始算起,达到所设定的定时时间后,再以常用级别次之的“暴”进行发音提醒。自以“暴”提醒时开始算起,达到所设定的定时时间后,若判断朗读者仍未恢复朗读时,则重新以“报”进行发音提醒,如此循环提醒,直至朗读者恢复朗读。可以理解地,该定时时间可根据需求进行设置。
69.该定时时间可以为可判断朗读者是否仍处于停滞状态的时间,可以理解地,步骤s30中,采用一同音字对生僻字进行发音提醒起开始计时,若达到该定时时间后朗读者仍处于停滞状态,则认为该同音字对朗读者而言仍属于生僻字,因此,替换另一同音字对生僻字
进行发音提醒。该定时时间可与正常时间间隔相同,或大于正常时间间隔,以给朗读者提供较多的辨别时间。或者,该定时时间或者小于正常时间间隔,例如定时时间为正常时间间隔的三分之一,以给朗读者显示更多的同音字。
70.当然,该判断朗读者是否处于停滞状态,同样可采用上述判断当前朗读速度是否小于正常朗读速度的方法实现,该与上述的判断方式相同,在此不再重复陈述。
71.在一些实施例中,间隔替换发音提醒的方式包括:通过接收朗读者输入的替换指令,进行同音字的替换提醒,同样的,该同音字的替换同样是由优先显示常用级别高的,即以常用级别高至常用级别低的顺序进行提醒。
72.本技术中,优先以常用级别高的同音字,即常用级别数字小的同音字对生僻字进行发音提醒,且通过多个同音字对生僻字进行发音提醒,可提高朗读者的朗读效率。在其它实施例中,可同时采用多个同音字对生僻字进行发音提醒。
73.其中,以同音字对生僻字进行发音提醒的方式可以为,将该同音字显示于生僻字的上方。可以理解地,文字内容中,每一行文字之间具有一间隔,将同音字显示于生僻字的上方,便于朗读者查看,也符合日常习惯。
74.可以理解地,在朗读者朗读朗读文本之前,可先将同音组库录入朗读设备中,因此,在朗读者的朗读过程中可通过同音组库实现生僻字的发音提醒,并且该同音字可通过突出的表现形式进行展示,例如同音字与朗读文本中的其它文字的颜、粗细、字体等不同。
75.可以理解地,同一朗读者对于不同朗读文本的朗读语速不同,不同朗读者对于同一朗读文本的朗读语速不同。因此,在步骤s20中,根据当前朗读者的朗读语速,即语音转换成文字的情况,对朗读文本中的文字进行跟踪;在步骤s30中,根据当前朗读者的朗读语速设置停滞条件。
76.本实施例中,基于朗读者的朗读语速,自动提示生僻字发音,且可依据朗读者的停滞情况动态更换同音字,可提高朗读者朗读的连贯性及朗读效率。
77.在本发明的另一实施例中,生僻字发音提醒方法包括如下步骤:
78.步骤s10、显示朗读文本。
79.步骤s20、接收朗读语音,识别朗读语音对应的文字,逐字跟踪朗读文本中的文字。
80.步骤s30、当判断朗读参数满足停滞条件时,根据跟踪进度将待朗读的首个文字作为生僻字,并对生僻字进行发音提醒。
81.该实施例与上述实施例的区别在于,步骤s30中,对生僻字进行发音提醒包括:以与生僻字同音的同音字对生僻字进行发音提醒;和/或,以生僻字的拼音对生僻字进行发音提醒;和/或,以语音的方式对生僻字进行发音提醒。
82.可以理解地,以与生僻字同音的同音字对生僻字进行发音提醒,与上述实施例的方法相同,在此不再详述。其中,以生僻字的拼音对生僻字进行发音提醒,具体地,可通过预先建立各文字的汉语拼音库,当识别出生僻字时,从汉语拼音库中检索出与该生僻字对应的汉语拼音,并将该汉语拼音对应显示在该生僻字的上方。当然,汉语拼音库可采用现有的汉语拼音库实现。
83.以语音的方式对生僻字进行发音提醒,具体地,可通过设置发声单元,当识别出生僻字时,通过发声单元播报该生僻字。
84.可以理解地,可采用上述一种或两种以上组合方式对生僻字进行发音提醒,以适用于多种人。
85.请参阅图2,图2是本发明的生僻字发音提醒装置的结构示意图,该生僻字发音提醒装置10所实现的功能与上述生僻字发音提醒方法相对应。如图2所示,该生僻字发音提醒装置10包括:
86.显示单元101,用于显示朗读文本。
87.可以理解地,朗读文本为可供人们朗读的文本,朗读文本可以为文章、新闻等文档类读物,朗读文本可以包括文字内容、图表内容等内容。
88.显示单元101中,显示朗读者所需进行朗读的朗读文本,以供朗读者观看并根据朗读文本进行朗读、以及供朗读者观看生僻字的提醒。可以理解地,朗读文本可根据朗读者的选择确定进行显示。
89.跟踪单元102,用于接收朗读语音,识别朗读语音对应的文字,逐字跟踪朗读文本中的文字。
90.可以理解地,朗读文本中的文字内容由若干文字组成,当人们朗读该文字内容时,根据该文字内容的行文方向,逐个朗读文字内容中的文字。例如,从汉字的特点和人的生理习惯来看,文字内容的行文方向一般为从上至下,自左而右,本实施例以该种行文方向为例进行说明。当然,一些文字内容的行文方向也可为从上至下,从左到右。
91.当朗读者对朗读文本进行朗读时,按照朗读文本的文字内容的行文方向,逐个朗读文字内容中的文字,即从上至下,自左而右逐一朗读文字。在朗读者朗读的过程中,接收朗读语音,识别朗读语音对应的文字,逐字跟踪朗读文本中的文字。具体地,接收朗读语音,可采用语音转换成文字的技术,识别出朗读语音对应的文字,通过所识别出的文字与文字内容中的文字进行匹配,逐字跟踪朗读文本中的文字。
92.可以理解地,该跟踪的过程也可理解为,根据当前朗读者的朗读语速,即根据朗读语音转换成文字的情况,逐渐调整跟踪速度,并采用适应于朗读语速的速度按照文字内容的行文方向,逐个跟踪朗读文本中的文字,使得跟踪文字与朗读文字同步。可以理解地,语音转换成文字的技术可直接采用现有技术实现,现有的语音转换成文字的技术例如百度、讯飞等第三方语音转换成文字的技术。
93.当然,也可通过接收朗读者输入的调节指令,根据调节指令进行跟踪进度的调节。例如,调节指令可包括暂停、快进等,该调节指令可通过按键等实现。在一些实施场景中,光标位置与跟踪进度是保持一致的,因此,可通过改变光标的位置,来调节当前的跟踪进度。
94.其中,所跟踪的当前的文字可以用其它颜、其它字体或其它表现形式突出显示,以表示跟踪或朗读进度。
95.执行单元103,用于当判断朗读参数满足停滞条件时,根据跟踪进度将待朗读的首个文字作为生僻字,并对生僻字进行发音提醒。
96.可以理解地,当朗读者的朗读参数满足停滞条件时,认为朗读者出现停滞,同时停滞跟踪。
97.本实施例的生僻字发音提醒装置10还包括:接收获取单元,用于接收试读语音,根据试读语音获取正常朗读状态下的正常时间间隔、正常朗读速度。
98.可以理解地,朗读者在正式朗读之前,可先输入一段在正常朗读状态下的语音,作
为试读语音。该试读语音可通过朗读者正常朗读一朗读文本的全部或部分内容实现输入;或者,通过播放朗读者在正常讲话状态下的讲话语音进行输入;或者,通过直接输入相应的语音,将朗读者输入的语音作为试读语音。可以理解地,此处所说的正常朗读、正常讲话皆为了可获取朗读者的正常语速,非处于停顿等状态下的语速。
99.接收试读语音,并且根据该试读语音获取朗读者在正常朗读状态下的正常时间间隔、正常朗读速度。可以理解地,可在朗读者的正常朗读或正常讲话过程中,计算朗读过程中两个文字之间的时间间隔,得到正常时间间隔。可在朗读者的正常朗读或正常讲话过程中,通过朗读者在额定时间内所完成朗读或讲话的额定文字字数,得到正常朗读速度。可以理解地,该正常时间间隔、正常朗读速度可为具体数值或数值区间。
100.执行单元103中,朗读参数可以为朗读的当前停滞时间,停滞条件则可以为正常时间间隔。可以理解地,当判断朗读参数满足停滞条件时,包括:当判断当前停滞时间大于正常时间间隔时,说明朗读者处于停滞状态,则认为朗读者遇到生僻字,并且按行文方向,将所跟踪的当前文字的后面的待朗读文字中的首个文字作为生僻字,并对该生僻字进行发音提醒。
101.或者,执行单元103中,朗读参数可以为当前朗读速度,停滞条件则可以为正常朗读速度。可以理解地,当判断朗读参数满足停滞条件时,包括:当判断当前朗读速度小于正常朗读速时,即当朗读者在额定时间内未能完成额定文字字数的朗读时,认为当前朗读速度小于正常朗读速度,说明朗读者处于停滞状态,则认为朗读者遇到生僻字,并对该生僻字进行发音提醒。
102.在本实施例中,对生僻字进行发音提醒的方式包括:以与生僻字同音的同音字对生僻字进行发音提醒;其中,同音字相对生僻字更为常用。
103.本实施例的生僻字发音提醒装置10还包括:分组划分单元,用于对各文字进行常用级别的划分,常用级别高的文字相对常用级别低的文字更为常用;将已划分常用级别的文字中的同音字进行分组,形成同音组库。
104.该分组划分单元可在显示单元101之前执行。可以理解地,在朗读者进行朗读之前,先对各文字进行处理,使得可采用同音字对生僻字进行发音提醒。
105.各文字的获取包括:通过自行抽取样本文本,对样本文本中的文字内容进行单字切割统计,得到各文字;或者,获取输入法的第三方统计数据,得到各文字。
106.当各文字为通过自行抽取样本文本得到时,对各文字进行常用级别的划分包括:根据各文字出现的次数对各文字进行常用级别的划分。可以理解地,样本文本可以为新闻、文章等文档读物,并且可采用一个或多个样本文本,样本文本中的文字内容尽可能囊括较多文字,使得文字较为全面。
107.可以理解地,单字切割统计,例如文字内容包括“报抱暴豹古”等文字,则可切割为“报”、“抱”、“暴”、“豹”、“古”各文字,并统计各个文字出现的次数,例如,若“报”、“抱”、“暴”、“豹”、“古”分别出现了30次、20次、15次、8次、10次,则可采用常用级别来区分各文字的常用程度,此处出现次数较高的文字的常用级别相对出现次数较低的文字的常用级别更高。常用级别可以包括多个,例如常用级别包括常用级别1至常用级别10共10个常用级别,常用级别的数字越小代表常用级别越高。
108.当各文字通过获取输入法的第三方统计数据得到时,对各文字进行常用级别的划
分包括:根据各文字的使用次数对各文字进行常用级别的划分。其中,输入法可以为搜狗、百度输入法,使用次数较高的常用级别相对使用次数较低的文字的常用级别更高。
109.完成各文字的常用级别划分后,将已划分常用级别的文字中的同音字进行分组,形成同音组库。可以理解地,同音字为拼音相同且语调相同。例如上述文字内容中的“报”、“抱”、“暴”、“豹”的读音皆为“b
à
o”,因此该多个文字为同音字,并且将该多个同音字分在一同音组中,因此该同音组中包括常用级分别为常用级别2、常用级别4、常用级别6、常用级别8的同音字“报”、“抱”、“暴”、“豹”,并可根据常用级别进行各同音字的排序。可以理解地,该同音组中各同音字的常用级别只是用于举例说明,并不代表实际的常用级别。多个同音组如此设置,组成同音组库。
110.在一些实施例中,分组划分单元中,将各文字中的同音字进行分组;对各组中的各文字进行常用级别的划分,常用级别高的文字相对常用级别低的文字更为常用,形成同音组库。
111.可以理解地,该一些实施例中的分组划分单元与本实施例中的分组划分单元所执行的内容的区别在于,在本实施例中,先完成各文字的常用级别划分,再将已划分常用级别的文字中的同音字进行分组。而一些实施例中,则是先对各文字中的同音字进行分组,再对各组中的各文字进行常用级别的划分。可以理解地,两者仅是执行的顺序不同。在本发明中,不对该两步骤的执行顺序进行限制,只要能实现在同音组库中形成各同音字组,且各同音组中的各文字皆有对应的常用级别即可,当然,各同音字组中的文字可按常用级别进行排序。
112.在执行单元103中,以与生僻字同音的同音字对生僻字进行发音提醒;其中,同音字相对生僻字更为常用。具体为,当识别出生僻字时,在同音组库中检索出与该生僻字同组的同音字,并获取常用级别比生僻字高的同音字对生僻字进行发音提醒。
113.进一步地,获取常用级别比生僻字高的同音字对生僻字进行发音提醒,包括:获取常用级别比生僻字高的多个同音字对生僻字进行间隔替换发音提醒;其中,多个同音字中,常用级别高的文字优先提醒。
114.具体地,通过在同音组库中检索出常用级别比生僻字高的所有同音字,并且获取常用级别较高的几个同音字,例如获取常用级别最高的三个同音字,对生僻字进行间隔替换发音提醒。
115.当然,也可以以其它数量的同音字进行替换提醒,例如当常用级别比生僻字高的同音字多于三个时,该多个同音字间隔替换,或者以常用级别较高的前几个同音字进行间隔替换;当常用级别比生僻字高的同音字小于三个时,以全部的同音字进行间隔替换。
116.该间隔替换发音提醒的方式包括:三个同音字定时间隔替换,例如,当所识别出来的生僻字为“豹”,则在同音组库中检索,检索出文字“豹”所在的同音组“报”、“抱”、“暴”、“豹”。在该同音组中,文字“报”、“抱”、“暴”比文字“豹”的常用级别高,因此,可以“报”、“抱”、“暴”轮流替换进行发音提醒。
117.例如,先以常用级别最高的同音字“报”进行发音提醒,自以“报”提醒时开始算起,当达到所设定的定时时间后,再以常用级别次之的同音字“抱”进行发音提醒;自以“抱”提醒时开始算起,达到所设定的定时时间后,再以常用级别次之的“暴”进行发音提醒。自以“暴”提醒时开始算起,达到所设定的定时时间后,若判断朗读者仍未恢复朗读时,则重新以“报”进行发音提醒,如此循环提醒,直至朗读者恢复朗读。可以理解地,该定时时间可根据需求进行设置。
118.该定时时间可以为可判断朗读者是否仍处于停滞状态的时间,可以理解地,执行单元103中,采用一同音字对生僻字进行发音提醒起开始计时,若达到该定时时间后朗读者仍处于停滞状态,则认为该同音字对朗读者而言仍属于生僻字,因此,替换另一同音字对生僻字进行发音提醒。该定时时间可与正常时间间隔相同,或大于正常时间间隔,以给朗读者提供较多的辨别时间。或者,该定时时间或者小于正常时间间隔,例如定时时间为正常时间间隔的三分之一,以给朗读者显示更多的同音字。
119.当然,该判断朗读者是否处于停滞状态,同样可采用上述判断当前朗读速度是否小于正常朗读速度的方法实现,该与上述的判断方式相同,在此不再重复陈述。
120.在一些实施例中,间隔替换发音提醒的方式包括:通过接收朗读者输入的替换指令,进行同音字的替换提醒,同样的,该同音字的替换同样是由优先显示常用级别高的,即以常用级别高至常用级别低的顺序进行提醒。
121.本技术中,优先以常用级别高的同音字,即常用级别数字小的同音字对生僻字进行发音提醒,且通过多个同音字对生僻字进行发音提醒,可提高朗读者的朗读效率。在其它实施例中,可同时采用多个同音字对生僻字进行发音提醒。
122.其中,以同音字对生僻字进行发音提醒的方式可以为,将该同音字显示于生僻字的上方。可以理解地,文字内容中,每一行文字之间具有一间隔,将同音字显示于生僻字的上方,便于朗读者查看,也符合日常习惯。
123.可以理解地,在朗读者朗读朗读文本之前,可先将同音组库录入朗读设备中,因此,在朗读者的朗读过程中可通过同音组库实现生僻字的发音提醒,并且该同音字可通过突出的表现形式进行展示,例如同音字与朗读文本中的其它文字的颜、粗细、字体等不同。
124.可以理解地,同一朗读者对于不同朗读文本的朗读语速不同,不同朗读者对于同一朗读文本的朗读语速不同。因此,跟踪单元102中,根据当前朗读者的朗读语速,即语音转换成文字的情况,对朗读文本中的文字进行跟踪;在执行单元103中,根据当前朗读者的朗读语速设置停滞条件。
125.本实施例中,基于朗读者的朗读语速,自动提示生僻字发音,且可依据朗读者的停滞情况动态更换同音字,可提高朗读者朗读的连贯性及朗读效率。
126.在本发明的另一实施例中,生僻字发音提醒装置包括:
127.显示单元,用于显示朗读文本。
128.跟踪单元,用于接收朗读语音,识别朗读语音对应的文字,逐字跟踪朗读文本中的文字。
129.执行单元,用于当判断朗读参数满足停滞条件时,根据跟踪进度将待朗读的首个文字作为生僻字,并对生僻字进行发音提醒。
130.该实施例与上述实施例的区别在于,执行单元中,对生僻字进行发音提醒包括:以与生僻字同音的同音字对生僻字进行发音提醒;和/或,以生僻字的拼音对生僻字进行发音提醒;和/或,以语音的方式对生僻字进行发音提醒。
131.可以理解地,以与生僻字同音的同音字对生僻字进行发音提醒,与上述实施例的
执行方法相同,在此不再详述。其中,以生僻字的拼音对生僻字进行发音提醒,具体地,可通过预先建立各文字的汉语拼音库,当识别出生僻字时,从汉语拼音库中检索出与该生僻字对应的汉语拼音,并将该汉语拼音对应显示在该生僻字的上方。当然,汉语拼音库可采用现有的汉语拼音库实现。
132.以语音的方式对生僻字进行发音提醒,具体地,可通过设置发声单元,当识别出生僻字时,通过发声单元播报该生僻字。
133.可以理解地,可采用上述一种或两种以上组合方式对生僻字进行发音提醒,以适用于多种人。
134.本发明提供一种计算机装置,该计算机装置包括处理器和存储器,处理器通信连接存储器;存储器用于存储计算机程序;处理器用于执行存储器中存储的计算机程序以实现上述生僻字发音提醒方法的步骤。
135.本发明的一种可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如上述生僻字发音提醒方法的步骤。
136.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,上述的程序可存储于计算机、手机等终端设备的可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,上述的存储介质可为磁碟、光盘、只读存储记忆体(read-only memory,rom)或随机存储记忆体(random access memory,ram)等。
137.可以理解的,以上实施例仅表达了本发明的优选实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制;应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,可以对上述技术特点进行自由组合,还可以做出若干变形和改进,这些都属于本发明的保护范围;因此,凡跟本发明权利要求范围所做的等同变换与修饰,均应属于本发明权利要求的涵盖范围。

技术特征:


1.一种生僻字发音提醒方法,其特征在于,包括:s10、显示朗读文本;s20、接收朗读语音,识别所述朗读语音对应的文字,逐字跟踪所述朗读文本中的文字;s30、当判断朗读参数满足停滞条件时,根据跟踪进度将待朗读的首个文字作为生僻字,并对所述生僻字进行发音提醒。2.根据权利要求1所述的生僻字发音提醒方法,其特征在于,对所述生僻字进行发音提醒包括:以与所述生僻字同音的同音字对所述生僻字进行发音提醒;其中,所述同音字相对所述生僻字更为常用。3.根据权利要求1或2所述的生僻字发音提醒方法,其特征在于,对所述生僻字进行发音提醒包括:以所述生僻字的拼音对所述生僻字进行发音提醒,和/或以语音的方式对所述生僻字进行发音提醒。4.根据权利要求2所述的生僻字发音提醒方法,其特征在于,还包括:对各文字进行常用级别的划分,常用级别高的文字相对常用级别低的文字更为常用;将已划分常用级别的文字中的同音字进行分组,形成同音组库;或者,将各文字中的同音字进行分组;对各组中的各文字进行常用级别的划分,常用级别高的文字相对常用级别低的文字更为常用,形成同音组库;步骤s30中,以与所述生僻字同音的同音字对所述生僻字进行发音提醒;其中,所述同音字相对所述生僻字更为常用;包括:在所述同音组库中检索与所述生僻字同组的同音字,并获取常用级别比所述生僻字高的同音字对所述生僻字进行发音提醒。5.根据权利要求4所述的生僻字发音提醒方法,其特征在于,所述各文字包括:自行抽取样本文本,对所述样本文本进行单字切割统计,得到各文字;或者,获取输入法的第三方统计数据,得到各文字;当各文字通过自行抽取样本文本得到时,对各文字进行常用级别的划分包括:根据各文字出现的次数对各文字进行常用级别的划分;当各文字通过获取输入法的第三方统计数据得到时,对各文字进行常用级别的划分包括:根据各文字的使用次数对各文字进行常用级别的划分。6.根据权利要求4所述的生僻字发音提醒方法,其特征在于,获取常用级别比所述生僻字高的同音字对所述生僻字进行发音提醒,包括:获取常用级别比所述生僻字高的多个同音字对所述生僻字进行间隔替换发音提醒;其中,多个同音字中,常用级别高的文字优先提醒。7.根据权利要求1所述的生僻字发音提醒方法,其特征在于,还包括:接收试读语音,根据所述试读语音获取正常朗读状态下的正常时间间隔、正常朗读速度;所述朗读参数为当前停滞时间,所述停滞条件为所述正常时间间隔;步骤s30中,当判断朗读参数满足停滞条件时,包括:当判断当前停滞时间大于所述正常时间间隔时;或者,所述朗读参数为当前朗读速度,所述停滞条件为所述正常朗读速度;步骤s30中,当判断朗读参数满足停滞条件时,包括:当判断当前朗读速度小于所述正常朗读速度时。8.根据权利要求2所述的生僻字发音提醒方法,其特征在于,以与所述生僻字同音的同音字对所述生僻字进行发音提醒的提醒方式包括:将所述同音字显示于所述生僻字的上
方。9.一种生僻字发音提醒装置,其特征在于,包括:显示单元,用于显示朗读文本;跟踪单元,用于接收朗读语音,识别所述朗读语音对应的文字,逐字跟踪所述朗读文本中的文字;执行单元,用于当判断朗读参数满足停滞条件时,根据跟踪进度将待朗读的首个文字作为生僻字,并对所述生僻字进行发音提醒。10.一种计算机设备,其特征在于,包括处理器和存储器,所述处理器通信连接所述存储器;所述存储器用于存储计算机程序;所述处理器用于执行存储器中存储的计算机程序以实现如权利要求1-8任一项所述生僻字发音提醒方法。

技术总结


本发明涉及一种生僻字发音提醒方法、装置及计算机设备。该生僻字发音提醒方法包括:S10、显示朗读文本;S20、接收朗读语音,识别所述朗读语音对应的文字,逐字跟踪所述朗读文本中的文字;S30、当判断朗读参数满足停滞条件时,根据跟踪进度将待朗读的首个文字作为生僻字,并对所述生僻字进行发音提醒。本发明中,当检测到朗读者在朗读过程中遇到生僻字时,可自动对该生僻字进行发音提醒,无须朗读者自行查询,从而提高朗读的连贯性及朗读效率。从而提高朗读的连贯性及朗读效率。从而提高朗读的连贯性及朗读效率。


技术研发人员:

包伟

受保护的技术使用者:

深圳市世强元件网络有限公司

技术研发日:

2022.05.25

技术公布日:

2022/10/10

本文发布于:2024-09-21 15:35:00,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/28379.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:生僻字   同音字   文字   发音
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议