文本纠错及文本纠错词库构建方法与流程



1.本说明书实施例涉及计算机技术领域,特别涉及一种文本纠错及文本纠错词库构建方法。


背景技术:



2.语音识别技术是以语音为研究对象,通过语音信号处理和模式识别让机器自动识别和理解人类口述的语言。语音识别技术就是让机器通过识别和理解过程把语音数据转变为相应文本的技术。
3.但是,由于受口音、口语习惯等主观或客观因素影响,语音识别技术往往存在识别不准确的问题,因此,需要对语音识别文本进行纠错处理,即对语音识别文本中的错误进行修正,以得到更为准确的语音识别文本。因此,文本纠错是语音识别技术中至关重要的一个分支。需要提供更为准确的文本纠错方案。


技术实现要素:



4.有鉴于此,本说明书实施例提供了一种文本纠错方法。本说明书一个或者多个实施例同时涉及一种文本纠错词库构建方法,一种文本纠错装置,一种文本纠错词库构建装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序,以解决现有技术中存在的技术缺陷。
5.根据本说明书实施例的第一方面,提供了一种文本纠错方法,包括:
6.接收客户端发送的当前会话的文本编辑消息;
7.对文本编辑消息进行解析,获得当前会话下生成的纠错词对;
8.获得实时语音识别文本,利用纠错词对,对实时语音识别文本进行纠错,得到纠错文本;
9.将纠错文本发送至客户端进行显示。
10.根据本说明书实施例的第二方面,提供了一种文本纠错词库构建方法,包括:
11.获取当前会话的文本编辑消息;
12.对文本编辑消息进行解析,获得当前会话下生成的纠错词对;
13.将纠错词对存储至当前会话的文本纠错词库,其中,文本纠错词库用于对待纠错文本进行纠错。
14.根据本说明书实施例的第三方面,提供了一种文本纠错装置,包括:
15.接收模块,被配置为接收客户端发送的当前会话的文本编辑消息;
16.第一解析模块,被配置为对文本编辑消息进行解析,获得当前会话下生成的纠错词对;
17.纠错模块,被配置为获得实时语音识别文本,利用纠错词对,对实时语音识别文本进行纠错,得到修正文本;
18.发送模块,被配置为将修正文本发送至客户端进行显示。
19.根据本说明书实施例的第四方面,提供了一种文本纠错词库构建装置,包括:
20.获取模块,被配置为获取当前会话的文本编辑消息;
21.第二解析模块,被配置为对文本编辑消息进行解析,获得当前会话下生成的纠错词对;
22.存储模块,被配置为将纠错词对存储至当前会话的文本纠错词库,其中,文本纠错词库用于对待纠错文本进行纠错。
23.根据本说明书实施例的第五方面,提供了一种计算设备,包括:
24.存储器和处理器;
25.所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现上述文本纠错方法的步骤或文本纠错词库构建方法的步骤。
26.根据本说明书实施例的第六方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现上述文本纠错方法的步骤或文本纠错词库构建方法的步骤。
27.根据本说明书实施例的第七方面,提供了一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述文本纠错方法的步骤或文本纠错词库构建方法的步骤。
28.本说明书一个实施例中,通过接收客户端发送的当前会话的文本编辑消息,对文本编辑消息进行解析,获得当前会话下生成的纠错词对,获得实时语音识别文本,利用纠错词对,对实时语音识别文本进行纠错,得到修正文本,将修正文本发送至客户端进行显示。用户在客户端进行文本编辑,相应地会接收到客户端发送的当前会话的文本编辑消息,文本编辑消息表征了用户对文本中的错词进行编辑的行为,通过对文本编辑消息进行解析,能够获得当前会话下生成的纠错词对,即用户编辑行为产生的纠错词对,针对接下来获得的实时语音识别文本,可以利用该纠错词对,对实时语音识别文本进行纠错,并将纠错得到的修正文本发送至客户端进行显示,由于纠错词对是用户在客户端进行文本编辑时产生的,则在对后续接收的实时语音识别文本进行纠错时,符合用户的实际编辑需求,实现了定制化的文本纠错,并且,用户一次文本编辑,在后续的语音识别中都可以快速纠错,提高了对语音识别文本纠错的效率和准确度。
附图说明
29.图1是本说明书一个实施例提供的一种文本纠错方法的流程图;
30.图2是本说明书一个实施例提供的一种文本纠错方法中语义纠错模型进行纠错替换的架构图;
31.图3是本说明书一个实施例提供的一种文本纠错方法的处理过程流程图;
32.图4是本说明书一个实施例提供的一种文本纠错词库构建方法的流程图;
33.图5是本说明书一个实施例提供的一种文本纠错装置的结构示意图;
34.图6是本说明书一个实施例提供的一种文本纠错词库构建装置的结构示意图;
35.图7是本说明书一个实施例提供的一种计算设备的结构框图。
具体实施方式
36.在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
37.在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
38.应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”。
39.首先,对本说明书一个或多个实施例涉及的名词术语进行解释。
40.语音识别技术:也被称为自动语音识别(asr,automatic speech recognition),就是让智能设备听懂人类的语音。其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。语音识别技术是一门涉及数字信号处理、人工智能、语言学、数理统计学、声学、情感学及心理学等多学科交叉的科学。这项技术可以提供比如自动客服、自动语音翻译、命令控制、语音验证码等多项应用。近年来,随着人工智能的兴起,语音识别技术在理论和应用方面都取得大突破,开始从实验室走向市场,已逐渐走进我们的日常生活。现在语音识别己用于许多领域,主要包括语音识别听写器、语音寻呼和答疑平台、自主广告平台,智能客服等。
41.文本纠错技术:是自然语言处理领域检测一段文字是否存在错别字、以及将错别字纠正过来的技术,一般用于文本预处理阶段,同时能显著缓解智能客服等场景下asr不准确的问题。
42.bert(bidirectional encoder representations from transformers):是一个语言表示模型。它的主要模型结构是翻译模型(transformer)的编码层(encoder)堆叠而成,它其实是一个2阶段的框架,分别是预训练,以及在各个具体任务上进行微调。预训练阶段需要大量的数据,以及大量的计算机资源,一般可以获取到开源了的语言预训练模型,然后直接在这个基础上进行微调。
43.roberta:一种改进的bert模型。
44.掩码语言模型(mlm,masked language model):实际上就是一个完形填空任务,随机掩码掉文本中的某些字词,然后由模型去预测被掩码的字词。
45.多阶段决策问题:在现实生活中,有一类活动的过程,由于它的特殊性,可将过程分成若干个互相联系的阶段,在它的每一阶段都需要作出决策,从而使整个过程达到理想的活动效果。因此各个阶段决策的选取不能任意确定,它依赖于当前面临的状态,又影响以后的发展。当各个阶段决策确定后,就组成一个决策序列,因而也就确定了整个过程的一条活动路线,这种把一个问题看作是一个前后关联具有链状结构的多阶段过程就称为多阶段
决策过程,这种问题称为多阶段决策问题。
46.动态规划(dp,dynamic programming):在多阶段决策问题中,各个阶段采取的决策,一般来说是与时间有关的,决策依赖于当前状态,又随即引起状态的转移,一个决策序列就是在变化的状态中产生出来的,故有“动态”的含义,称这种解决多阶段决策的过程为动态规划。
47.在本说明书中,提供了一种文本纠错方法,本说明书同时涉及一种文本纠错词库构建方法,一种文本纠错装置,一种文本纠错词库构建装置,一种计算设备,以及一种计算机可读存储介质,在下面的实施例中逐一进行详细说明。
48.本说明书实施例所提供的文本纠错方法的执行主体可以为提供文本纠错功能的计算设备,也可以为提供语音识别功能的计算设备,例如实时会议设备、语音问答设备、个人计算机等,执行主体还可以为后台服务器,由后台服务器提供文本纠错功能。本说明书实施例所提供的文本纠错方法可以被设置于执行主体中的软件、硬件电路、逻辑电路中的至少一种执行实现。
49.参见图1,图1示出了根据本说明书一个实施例提供的一种文本纠错方法的流程图,具体包括以下步骤。
50.步骤102:接收客户端发送的当前会话的文本编辑消息。
51.在本说明书中,客户端指的是给用户提供文本编辑接口的前端,可以是应用程序、网页等,客户端还可以是提供语音识别功能的前端设备,例如实时会议设备、录音设备、语音问答设备等。
52.在计算机技术中,尤其是在网络应用中,会话(session)是指一个用户与计算机/网络进行交互的时间间隔,通常指一个用户从登录进入计算机/网络到退出之间所经过的时间。在本说明书中,当前会话的文本编辑消息指的就是当前登录客户端的用户在客户端实时输入的文本编辑消息。
53.在实际应用中,例如实时会议场景下,客户端可以实时地显示对语音数据进行语音识别后生成的语音识别文本,登录客户端的用户可以实时地看到该语音识别文本,客户端为用户提供了文本编辑的功能,如果用户发现语音识别文本中存在错误,可以手动地进行编辑,对错误内容进行修改。用户可以直接在语音识别文本中进行编辑;客户端也可以在交互界面上提供一个文本编辑区域,例如文本编辑框,在用户有文本编辑需求时,通过选择待编辑的文本片段(可以是语音设备文本中的一段、一句等),在文本编辑框中显示该文本片段,用户可以对文本编辑框中显示的文本片段有针对性地进行编辑,其中,文本编辑框可以是以弹窗形式显示或者以固定位置形式显示,这里不做具体限定。
54.文本编辑消息是指用户对语音识别文本进行编辑时产生的消息,主要包括文本编辑行为发生前后的信息,例如上述待编辑的文本片段的标识信息(例如语音识别文本的第几段、第几句、第几行的文本片段)、语音识别文本的标识信息(例如语音设备文本的名称、创建时间等)、编辑的词语对(例如将“涉猎”改成“策略”,则可以携带词语对“涉猎-策略”)、编辑前的原始文本片段、编辑后的目标文本片段等。
55.用户在进行文本编辑时,根据用户的输入习惯,在对某一个词进行编辑时,有可能逐字地进行编辑,在输入一个字之后可能会停顿一下再输入下一个字,这就有可能导致分别被识别为独立的文本编辑操作,但实际上是对一个词进行编辑,应属于一次文本编辑操
作。
56.为了应对上述情况,客户端可以对用户进行文本编辑的操作进行监听,如果多次编辑的间隔时间过短(例如小于3秒),则会被识别为是一次文本编辑操作,统计该多次编辑的文本编辑消息统一发送。也就是说,客户端在识别到有用户进行文本编辑时(即用户在客户端界面上触发文本编辑操作),会统计用户在预设间隔时间内产生的文本编辑信息,然后将预设间隔时间内统计的文本编辑信息以消息的形式发送至本说明书实施例的执行主体。
57.在本说明书实施例的一种实现方式中,步骤102具体可以通过如下方式实现:接收客户端在预设间隔时间内发送的多个文本编辑消息;整合多个文本编辑消息,得到当前会话的文本编辑消息。
58.针对于上述文本编辑操作识别的问题,本说明书的另一种实现方式中,还可以是客户端在识别到用户进行文本编辑时,就将本次产生的文本编辑消息发送至本说明书实施例的执行主体,如果在预设间隔时间内接收到客户端发送的多个文本编辑消息,则这多个文本编辑消息应被识别为一次文本编辑操作产生,因此,会对该多个文本编辑消息进行整合,具体的整合内容就是将多个文本编辑消息携带的所有信息都提取出来,然后打包在一个消息中,即得到当前会话的文本编辑消息。
59.通过设定预设间隔时间,接收客户端在预设间隔时间内发送的多个文本编辑消息,然后对该多个文本编辑消息进行整合,能够有效地应对一次文本编辑操作可能被识别为多次独立的文本编辑操作的问题,保证文本编辑操作识别的准确性,进一步提升文本纠错的效率。
60.步骤104:对文本编辑消息进行解析,获得当前会话下生成的纠错词对。
61.在接收到客户端发送的当前会话的文本编辑消息后,可以对文本编辑消息进行解析,通过解析可以获得当前会话下生成的纠错词对。一种情况下,客户端可以直接对用户编辑的词语进行识别记录,则文本编辑消息中可以直接携带纠错词对;还有一种情况下,客户端对用户的文本编辑操作进行识别,识别的是用户编辑的文本片段,则文本编辑消息中可以包括编辑前的原始文本片段和编辑后的目标文本片段。
62.在本说明书实施例的一种实现方式中,文本编辑消息可以包括编辑前的原始文本片段和编辑后的目标文本片段。相应地,步骤104具体可以通过如下方式实现:
63.对原始文本片段和目标文本片段进行文本对齐和分词处理,得到原始文本片段的第一分词序列和目标文本片段的第二分词序列;
64.基于第一分词序列和第二分词序列,确定纠错词对。
65.针对于文本编辑消息包括编辑前的原始文本片段和编辑后的目标文本片段的情况,可以从文本编辑消息中提取出原始文本片段和目标文本片段,然后对原始文本片段和目标文本片段进行文本对齐和分词处理。其中,文本对齐处理和分词处理的执行先后顺序不做限定,可以先对原始文本片段和目标文本片段进行文本对齐处理,在将原始文本片段和目标文本片段进行文本对齐处理之后,再对文本对齐后的原始文本片段和目标文本片段进行分词处理,得到原始文本片段的第一分词序列和目标文本片段的第二分词序列;也可以先对原始文本片段和目标文本片段进行分词处理,在将原始文本片段和目标文本片段进行分词处理之后,再对分词后的原始文本片段和目标文本片段进行文本对齐处理,得到原始文本片段的第一分词序列和目标文本片段的第二分词序列。其中,文本对齐处理就是将
两个文本片段转换为字符序列,然后将字符序列中的字符元素进行一一对应;在进行分词处理时,可以采用分词工具(例如结巴分词工具)进行分词,也可以根据各个词语的词性、长度等进行分词。
66.在得到第一分词序列和第二分词序列后,基于第一分词序列和第二分词序列可以确定出纠错词对,具体地,可以将第一分词序列和第二分词序列中的对应分词进行对比,进一步确定出纠错词对,具体的对比方式可以是将对应位置的分词一一取出,然后进行比较,判断是否相同,如果不同,则可确定为纠错词对。
67.优选地,在基于第一分词序列和第二分词序列确定纠错词对时,可以采用基于dp的编辑距离(edit-distance)算法,编辑距离算法指的是在两个分词序列s1和s2之间,由其中一个分词序列s1转换为另一个分词序列s2所需要的最少单字符编辑操作的次数,其中,单字符编辑操作可以包括插入、删除和替换,针对分词序列s1中的任一个字符,统计其经过单字符编辑操作转换成分词序列s2中任一个字符所需操作的次数,然后基于统计的次数可以生成一个矩阵,该矩阵的横坐标为分词序列s1中的各字符、纵坐标为分词序列s2中的各字符,矩阵中的元素就是各字符之间相互变换的次数,矩阵中元素的分值越大,则说明对应位置的字符差距越大,则在得到矩阵之后,再结合回溯操作,即结合相邻元素的分值,推导出纠错词对。
68.例如,编辑前的原始文本片段为“因为传统的像一些cta的一个趋势的一个涉猎”,用户对该原始文本片段进行文本编辑,得到编辑后的目标文本片段为“因为传统的像一些cta的趋势策略”,在对原始文本片段和目标文本片段进行文本对齐和分词处理后,得到原始文本片段的第一分词序列和目标文本片段的第二分词序列:
69.[因为/传统/的/像/一些/cta/的/一个/趋势/的/一个/涉猎]
[0070]
[因为/传统/的/像/一些/cta/的/**/趋势/*/**/策略]
[0071]
基于第一分词序列和第二分词序列,即可得到纠错词对:涉猎-策略。
[0072]
通过对原始文本片段和目标文本片段进行文本对齐、分词处理,得到原始文本片段的第一分词序列和目标文本片段的第二分词序列,然后基于第一分词序列和第二分词序列,即可确定出纠错词对,能够准确地确定出纠错词对。
[0073]
在本说明书实施例的一种实现方式中,在步骤104之前,该文本纠错方法还可以包括如下步骤:
[0074]
获取编辑前的原始文本片段的第一文本长度、编辑后的目标文本片段的第二文本长度;
[0075]
根据第一文本长度和第二文本长度,计算文本长度差。
[0076]
相应地,可以在文本长度差未超过预设阈值的情况下,执行步骤104。
[0077]
用户在对语音识别文本进行文本编辑时,一般是对错误的字词进行修改,如果是大篇幅地进行修改,例如将一个词改为一大段文本,或者将一大段内容改为一个字,这些都不属于错误修改的范畴,也就无需对这一类的文本编辑消息进行解析。因此,为了避免这种大篇幅修改的无效且耗时的冗余解析,在本说明书的一个实施例中,可以获取编辑前的原始文本片段的第一文本长度和编辑后的目标文本片段的第二文本长度,然后将第一文本长度和第二文本场景作差,计算得到文本长度差。如果文本长度差未超过预设阈值,也就是进行了小范围的修改,则可执行步骤104,对文本编辑消息进行解析;如果文本长度差超过了
预设阈值,也就是进行了大篇幅的修改,则不会执行步骤104,即不会进行后续的文本纠错处理。
[0078]
步骤106:获得实时语音识别文本,利用纠错词对,对实时语音识别文本进行纠错,得到修正文本。
[0079]
在经过对文本编辑信息进行解析获得当前会话下生成的纠错词对之后,可以获得实时语音识别文本,实时语音识别文本就是在用户进行文本编辑后实时生成的语音识别文本,例如在会议场景下,用户对会议第5分钟生成了语音识别文本进行了编辑,得到了纠错词对,则对于同一会议场景下,接下来生成的实时语音识别文本,可以直接利用上述纠错词对,对实时语音识别文本进行纠错。
[0080]
在本说明书实施例的一种实现方式中,在步骤104之后,该文本纠错方法还可以包括如下步骤:将纠错词对存储至当前会话的文本纠错词库。
[0081]
相应地,步骤106具体可以通过如下方式实现:从文本纠错词库中读取纠错词对,利用纠错词对,对实时语音识别文本进行纠错,得到修正文本。
[0082]
在具体实现时,为了适应一个用户的文本编辑操作,在具体场景中,用户对于语音识别文本往往不止编辑一次,则会创建该用户对应的文本纠错词库,即当前会话的文本纠错词库,在对文本编辑消息进行解析得到当前会话下生成的纠错词对之后,会将纠错词对存储至该文本纠错词库,由当前会话的文本纠错词库对当前会话下生成的纠错词对进行维护。文本纠错词库作为半持久化的存储单元,可以只存储用户登录阶段生成的纠错词对,则在该用户的登录期间,可以从当前会话的文本纠错词库中读取纠错词对,利用读取的纠错词对,对实时语音识别文本进行纠错,得到修正文本,达到针对特定用户的定制化纠错效果。文本纠错词库在存储纠错词对的同时,还可以对编辑后的目标文本片段进行存储。
[0083]
在本说明书实施例的一种实现方式中,文本编辑消息包括用户标识;
[0084]
在执行将纠错词对存储至当前会话的文本纠错词库的步骤之后,该文本纠错方法还可以包括如下步骤:
[0085]
在达到预设触发条件的情况下,从文本纠错词库中提取目标纠错词对;
[0086]
将目标纠错词对存储至用户标识对应的用户数据库中。
[0087]
本说明书实施例还可以提供对纠错词对进行持久化存储的功能,也就是说,还可以创建用户对应的用户数据库,在达到预设触发条件的情况下,例如本次会议结束、会议时长达到一定的时长等,则可以从文本纠错词库中提取出目标纠错词对,然后将目标纠错词对存储至相应的用户数据库中。则在用户下一次登录时,可以从持久化的目标数据库中读取之前进行文本编辑生成的纠错词对,在本次的语音识别任务中可实现高效、定制化的文本纠错。目标数据库在存储纠错词对的同时,还可以对编辑后的目标文本片段进行存储。
[0088]
具体地,从文本纠错词库中提取目标纠错词对的方式,可以是从文本纠错词库中提取出本次语音识别任务生成的所有纠错词对作为目标纠错词对存储至用户数据库中,也可以是从文本纠错词库中提取出本次语音识别任务生成的部分满足预设条件的纠错词对作为目标纠错词对存储至用户数据库中,其中,预设条件可以是本次语音识别任务中词对替换次数达到一定次数。
[0089]
在本说明书实施例的一种实现方式中,该文本纠错方法还可以包括如下步骤:
[0090]
从文本纠错词库或用户数据库中,获取历史纠错词对;
[0091]
将当前会话下生成的纠错词对与历史纠错词对进行冲突分析;
[0092]
如果存在冲突,则删除历史纠错词对。
[0093]
在具体的语音识别任务场景下,同一用户对于同一句子在不同文本片段中出现时,修改的内容可能不同,之前编辑生成的历史纠错词对存储于文本纠错词库或者用户数据库中,则可以从文本纠错词库或者用户数据库中获取到历史纠错词对,然后将当前会话下生成的纠错词对与历史纠错词对进行冲突分析,具体的冲突分析过程,就是针对于同一个目标原词,从包含该目标原词的将当前会话下生成的纠错词对、历史纠错词对中分别提取出候选词,判断两个候选词是否相同,或者有包含的关系。如果两个候选词相同或有包含的关系,则认为当前会话下生成的纠错词对与历史纠错词对之间无冲突,均可保留;如果两个候选词完全不同,则认为当前会话下生成的纠错词对与历史纠错词对之间存在冲突,则需要删除历史纠错词对,即从文本纠错词库或用户数据库中均删除历史纠错词对。当然,由于两次的文本编辑属于冲突行为,存在冲突的情况下,也可以对当前会话下生成的纠错词对进行丢弃。
[0094]
在步骤106中获得实时语音识别文本具体可以是:获取实时语音数据,对实时语音数据进行识别,得到实时语音识别文本。也就是说,本说明书实施例的执行主体能够提供语音识别功能,接收到的是实时语音数据,然后利用asr技术对实时语音数据进行识别,得到实时语音识别文本。当然,本说明书实施例中的实时语音识别文本也可以是其他语音识别设备发送的,这里不做具体限定。
[0095]
利用纠错词对,对实时语音识别文本进行纠错,就是根据纠错词对中的目标原词,利用词语匹配的方式,确定出实时语音识别文本中的错误原词,然后再利用纠错词对中的候选词替换掉该错误原词,即实现了对实时语音识别文本的纠错。这样直接替换的方式能够降低词语替换时所产生的能耗。
[0096]
在本说明书实施例的一种实现方式中,纠错词对包括目标原词和候选词;利用纠错词对,对实时语音识别文本进行纠错,得到修正文本的步骤具体可以通过如下方式实现:
[0097]
获取纠错词对对应的编辑后的目标文本片段;
[0098]
根据纠错词对,对实时语音识别文本中的目标原词进行掩码处理,得到目标处理文本;
[0099]
将目标处理文本和目标文本片段输入预训练的语义纠错模型,得到目标处理文本中掩码位置处是目标原词的第一概率、是候选词的第二概率;
[0100]
在第一概率和第二概率达到预设替换条件的情况下,将实时语音识别文本中的目标原词替换为候选词,得到修正文本。
[0101]
在一些特殊情况下,直接替换的方式虽然能够降低词语替换时所产生的能耗,但是并不一定符合实际场景,例如用户在语音识别文本中某一处的“涉猎”修改为“策略”,但是在后续的语音识别文本中出现文本片段“员工a涉猎广泛”,其中的“涉猎”并不属于错词,不应对其进行纠错。因此,在本说明书实施例的一种实现方式中,为了应对该问题,结合预训练的语义纠错模型进行文本纠错。
[0102]
具体地,会获取纠错词对对应的编辑后的目标文本片段(具体可以从文本纠错词库中获取),然后根据纠错词对,对实时语音识别文本中的目标原词进行掩码处理,掩码处理就是将实时语音识别文本中的目标原词进行掩藏,得到目标处理文本,这样就将实时语
音识别文本转换成类似于完形填空(cloze)问题。将目标处理文本和目标文本片段输入预训练的语义纠错模型,由语义纠错模型对目标处理文本进行cloze问题的处理,得到目标处理文本中掩码位置处是目标原词的第一概率、是候选词的第二概率,其中预训练的语义纠错模型可以为mlm模型,为了提升模型的精度,在输入目标处理文本和目标文本片段的同时,还可以输入目标文本片段的发音信息(即每个字的拼音)。在第一概率和第二概率达到预设替换条件的情况下,将实时语音识别文本中的目标原词替换为候选词,得到修正文本,其中,预设替换条件可以是第一概率小于第一预设阈值、且第二概率大于第二预设阈值,或者第一概率小于第一预设阈值、第二概率大于第二预设阈值、且第二概率与第一概率的差值大于第三阈值等。在第一概率和第二概率达到预设替换条件的情况下,说明需要进行纠错,且该纠错行为是准确的,则将实时语音识别文本中的目标原词替换为候选词,即可得到准确的修正文本。
[0103]
参见图2,图2示出了根据本说明书一个实施例提供的一种文本纠错方法中语义纠错模型进行纠错替换的架构图。其中,语义纠错模型采用phone-roberta模型,其中phone代表模型输入包括phone级别特征(即文本的发音信息)。例如,输入语义纠错模型的目标文本片段为“有一个美式期权”,目标处理文本(即图2中的“令牌(token)”)为“有一个美式[mask][mask]”,目标文本片段的phone基本特征为“you yi ge mei shi qi quan”,并相应增加位置索引和块索引信息,将这些输入到语义纠错模型中,在输出层的第6和第7个位置索引处,即会输出是目标原词“齐全”的第一概率和是候选词“期权”的第二概率,基于第一概率和第二概率即可确定是否进行替换。
[0104]
以实时语音识别文本为“这也是为了保持说我们对外宣传的一个策略跟实际交易的策略的一个延时性,而没有不会去发生一些涉猎的一个漂移”为例,纠错词对为“涉猎-策略”,编辑后的目标文本片段为“因为传统的像一些cta的趋势策略”。输入语义纠错模型的目标处理文本为“这也是为了保持说我们对外宣传的一个策略跟实际交易的策略的一个延时性,而没有不会去发生一些[mask][mask]的一个漂移”,目标文本片段为“因为传统的像一些cta的趋势策略”。则语义纠错模型的输出为[mask][mask]区域分别为“涉猎”和“策略”两个词的概率。
[0105]
步骤108:将修正文本发送至客户端进行显示。
[0106]
在得到修正文本之后,将修正文本发送至客户端,由客户端对修正文本进行显示,对于用户而言,用户在一次文本编辑后,后续的语音识别文本无需再进行手动编辑,在提升文本纠错效率的同时,后续的文本纠错对于用户而言完全无感,提升了用户体验。
[0107]
通过上述方法可以在用户无感的情况下,持续提升语音识别效果,例如,在当前会话中,语音识别文本为“因为传统的像一些cta的一个趋势的一个涉猎”,用户对其进行文本编辑,得到“因为传统的像一些cta的趋势策略”,根据上述步骤可以得到纠错词对“涉猎-策略”,则如果后续得到实时语音识别文本“基金经理会研究大盘和行业的趋势涉猎”,则会自动纠正为“基金经理会研究大盘和行业的趋势策略”。
[0108]
应用本说明书实施例,用户在客户端进行文本编辑,相应地会接收到客户端发送的当前会话的文本编辑消息,文本编辑消息表征了用户对文本中的错词进行编辑的行为,通过对文本编辑消息进行解析,能够获得当前会话下生成的纠错词对,即用户编辑行为产生的纠错词对,针对接下来获得的实时语音识别文本,可以利用该纠错词对,对实时语音识
别文本进行纠错,并将纠错得到的修正文本发送至客户端进行显示,由于纠错词对是用户在客户端进行文本编辑时产生的,则在对后续接收的实时语音识别文本进行纠错时,符合用户的实际编辑需求,实现了定制化的文本纠错,并且,用户一次文本编辑,在后续的语音识别中都可以快速纠错,提高了对语音识别文本纠错的效率和准确度。
[0109]
下述结合附图3,以本说明书提供的文本纠错方法在实时会议场景下的应用为例,对所述文本纠错方法进行进一步说明。其中,图3示出了本说明书一个实施例提供的一种文本纠错方法的处理过程流程图,具体包括以下步骤。
[0110]
第一步:前端通过监听事件,监听到了用户在前端的文本编辑行为,生成文本编辑消息。
[0111]
第二步:前端将文本编辑消息发送至会议软件的服务端。
[0112]
第三步:服务端触发用户行为分析模块。
[0113]
用户行为分析模块获取编辑前的原始文本片段的第一文本长度、编辑后的目标文本片段的第二文本长度,计算第一文本长度和第二文本长度之间的文本长度差,在文本长度差未超过预设阈值的情况下,对文本编辑消息进行解析,即对原始文本片段和目标文本片段进行文本对齐和分词处理,得到原始文本片段的第一分词序列和目标文本片段的第二分词序列,基于第一分词序列和第二分词序列,确定当前会话下生成的纠错词对,将纠错词对存储至当前会话的文本纠错词库。其中,具体对文本编辑消息进行解析的过程见图1所示实施例,这里不再赘述。同时,用户行为分析模块还会从文本纠错词库和用户数据库中获取历史纠错词对,将当前会话下生成的纠错词对与历史纠错词对进行冲突分析,如果存在冲突,则将文本纠错词库和用户数据库中的该历史纠错词对均删除。
[0114]
第四步,在会议结束或者达到预设时间的情况下,触发用户行为选择模块,从文本纠错词库中提取目标纠错词对存储至用户数据库中。
[0115]
第五步,获得实时语音数据,对实时语音数据进行文字识别,得到实时语音识别文本,然后驱动实时纠错代理模块。
[0116]
第六步,实时纠错代理模块从文本纠错词库中获取当前会话生成的纠错词对,对实时语音识别文本进行纠错,得到修正文本。
[0117]
其中,具体的纠错方式可以采用如图1所示实施例中的语义纠错模型的方式,具体过程见图1所示实施例,这里不再赘述。
[0118]
第七步,实时纠错代理模块将修正文本发送至客户端,上屏显示。
[0119]
利用本方案,用户在客户端进行文本编辑,相应地会接收到客户端发送的当前会话的文本编辑消息,文本编辑消息表征了用户对文本中的错词进行编辑的行为,通过对文本编辑消息进行解析,能够获得当前会话下生成的纠错词对,即用户编辑行为产生的纠错词对,针对接下来获得的实时语音识别文本,可以利用该纠错词对,对实时语音识别文本进行纠错,并将纠错得到的修正文本发送至客户端进行显示,由于纠错词对是用户在客户端进行文本编辑时产生的,则在对后续接收的实时语音识别文本进行纠错时,符合用户的实际编辑需求,实现了定制化的文本纠错,并且,用户一次文本编辑,在后续的语音识别中都可以快速纠错,提高了对语音识别文本纠错的效率和准确度。
[0120]
本说明书实施例所提供的文本纠错库构建方法的执行主体可以为数据服务端、控制端等。本说明书实施例所提供的文本纠错库构建方法可以被设置于执行主体中的软件、
硬件电路、逻辑电路中的至少一种执行实现。
[0121]
参见图4,图4示出了根据本说明书一个实施例提供的一种文本纠错词库构建方法的流程图,具体包括以下步骤。
[0122]
步骤402:获取当前会话的文本编辑消息。
[0123]
步骤402与图1所示实施例中的步骤102相似,当前会话的文本编辑消息指的就是当前登录客户端的用户在客户端实时输入的文本编辑消息。具体的实现详见图1所示实施例,这里不再赘述。
[0124]
步骤404:对文本编辑消息进行解析,获得当前会话下生成的纠错词对。
[0125]
步骤404与图1所示实施例中的步骤104相似,具体的实现详见图1所示实施例,这里不再赘述。
[0126]
步骤406:将纠错词对存储至当前会话的文本纠错词库,其中,文本纠错词库用于对待纠错文本进行纠错。
[0127]
为了适应一个用户的文本编辑操作,用户对于语音识别文本往往不止编辑一次,则会创建该用户对应的文本纠错词库,即当前会话的文本纠错词库,在对文本编辑消息进行解析得到当前会话下生成的纠错词对之后,会将纠错词对存储至该文本纠错词库,由当前会话的文本纠错词库对当前会话下生成的纠错词对进行维护。那么对于后续获得的待纠错文本,可以直接利用文本纠错词库进行纠错,其中,文本纠错词库可以是半持久化或者持久化的数据库,能够达到对特定用户的定制化纠错效果。
[0128]
应用本说明书实施例,用户进行文本编辑,相应地可以获取到当前会话的文本编辑消息,文本编辑消息表征了用户对文本中的错词进行编辑的行为,通过对文本编辑消息进行解析,能够获得当前会话下生成的纠错词对,即用户编辑行为产生的纠错词对,然后将纠错词对存储至当前会话的文本纠错词库,那么对于获得的待纠错文本,可以利用文本纠错词库进行纠错。由于纠错词对是用户进行文本编辑时产生的,则在对获得的待纠错文本进行纠错时,符合用户的实际编辑需求,实现了定制化的文本纠错,并且,用户一次文本编辑,可以对后续获得的待纠错文本进行快速纠错,提高了文本纠错的效率和准确度。
[0129]
与上述方法实施例相对应,本说明书还提供了文本纠错装置实施例,图5示出了本说明书一个实施例提供的一种文本纠错装置的结构示意图。如图5所示,该装置包括:
[0130]
接收模块520,被配置为接收客户端发送的当前会话的文本编辑消息;
[0131]
第一解析模块540,被配置为对文本编辑消息进行解析,获得当前会话下生成的纠错词对;
[0132]
纠错模块560,被配置为获得实时语音识别文本,利用纠错词对,对实时语音识别文本进行纠错,得到修正文本;
[0133]
发送模块580,被配置为将修正文本发送至客户端进行显示。
[0134]
应用本说明书实施例,用户在客户端进行文本编辑,相应地会接收到客户端发送的当前会话的文本编辑消息,文本编辑消息表征了用户对文本中的错词进行编辑的行为,通过对文本编辑消息进行解析,能够获得当前会话下生成的纠错词对,即用户编辑行为产生的纠错词对,针对接下来获得的实时语音识别文本,可以利用该纠错词对,对实时语音识别文本进行纠错,并将纠错得到的修正文本发送至客户端进行显示,由于纠错词对是用户在客户端进行文本编辑时产生的,则在对后续接收的实时语音识别文本进行纠错时,符合
用户的实际编辑需求,实现了定制化的文本纠错,并且,用户一次文本编辑,在后续的语音识别中都可以快速纠错,提高了对语音识别文本纠错的效率和准确度。
[0135]
可选地,文本编辑消息包括编辑前的原始文本片段和编辑后的目标文本片段;
[0136]
第一解析模块540,进一步被配置为对原始文本片段和目标文本片段进行文本对齐和分词处理,得到原始文本片段的第一分词序列和目标文本片段的第二分词序列;基于第一分词序列和第二分词序列,确定纠错词对。
[0137]
可选地,该装置还包括:
[0138]
文本长度差计算模块,被配置为获取编辑前的原始文本片段的第一文本长度、编辑后的目标文本片段的第二文本长度;根据第一文本长度和第二文本长度,计算文本长度差;
[0139]
第一解析模块540,进一步被配置为在文本长度差未超过预设阈值的情况下,对文本编辑消息进行解析,获得当前会话下生成的纠错词对。
[0140]
可选地,该装置还包括:
[0141]
第一存储模块,被配置为将纠错词对存储至当前会话的文本纠错词库;
[0142]
纠错模块560,进一步被配置为从文本纠错词库中读取纠错词对,利用纠错词对,对实时语音识别文本进行纠错,得到修正文本。
[0143]
可选地,文本编辑消息包括用户标识;该装置还包括:
[0144]
提取模块,被配置为在达到预设触发条件的情况下,从文本纠错词库中提取目标纠错词对;
[0145]
第二存储模块,被配置为将目标纠错词对存储至用户标识对应的用户数据库中。
[0146]
可选地,该装置还包括:
[0147]
冲突分析模块,被配置为从文本纠错词库或用户数据库中,获取历史纠错词对;将当前会话下生成的纠错词对与历史纠错词对进行冲突分析;
[0148]
删除模块,被配置为如果存在冲突,则删除历史纠错词对。
[0149]
可选地,接收模块520,进一步被配置为接收客户端在预设间隔时间内发送的多个文本编辑消息;整合多个文本编辑消息,得到当前会话的文本编辑消息。
[0150]
可选地,纠错词对包括目标原词和候选词;
[0151]
纠错模块560,进一步被配置为获取纠错词对对应的编辑后的目标文本片段;根据纠错词对,对实时语音识别文本中的目标原词进行掩码处理,得到目标处理文本;将目标处理文本和目标文本片段输入预训练的语义纠错模型,得到目标处理文本中掩码位置处是目标原词的第一概率、是候选词的第二概率;在第一概率和第二概率达到预设替换条件的情况下,将实时语音识别文本中的目标原词替换为所述候选词,得到修正文本。
[0152]
上述为本实施例的一种文本纠错装置的示意性方案。需要说明的是,该文本纠错装置的技术方案与上述的文本纠错方法的技术方案属于同一构思,文本纠错装置的技术方案未详细描述的细节内容,均可以参见上述文本纠错方法的技术方案的描述。
[0153]
与上述方法实施例相对应,本说明书还提供了文本纠错词库构建装置实施例,图6示出了本说明书一个实施例提供的一种文本纠错词库构建装置的结构示意图。如图6所示,该装置包括:
[0154]
获取模块620,被配置为获取当前会话的文本编辑消息;
[0155]
第二解析模块640,被配置为对文本编辑消息进行解析,获得当前会话下生成的纠错词对;
[0156]
存储模块660,被配置为将纠错词对存储至当前会话的文本纠错词库,其中,文本纠错词库用于对待纠错文本进行纠错。
[0157]
应用本说明书实施例,用户进行文本编辑,相应地可以获取到当前会话的文本编辑消息,文本编辑消息表征了用户对文本中的错词进行编辑的行为,通过对文本编辑消息进行解析,能够获得当前会话下生成的纠错词对,即用户编辑行为产生的纠错词对,然后将纠错词对存储至当前会话的文本纠错词库,那么对于获得的待纠错文本,可以利用文本纠错词库进行纠错。由于纠错词对是用户进行文本编辑时产生的,则在对获得的待纠错文本进行纠错时,符合用户的实际编辑需求,实现了定制化的文本纠错,并且,用户一次文本编辑,可以对后续获得的待纠错文本进行快速纠错,提高了文本纠错的效率和准确度。
[0158]
上述为本实施例的一种文本纠错词库构建装置的示意性方案。需要说明的是,该文本纠错词库构建装置的技术方案与上述的文本纠错词库构建方法的技术方案属于同一构思,文本纠错词库构建装置的技术方案未详细描述的细节内容,均可以参见上述文本纠错词库构建方法的技术方案的描述。
[0159]
图7示出了根据本说明书一个实施例提供的一种计算设备的结构框图。该计算设备700的部件包括但不限于存储器710和处理器720。处理器720与存储器710通过总线730相连接,数据库750用于保存数据。
[0160]
计算设备700还包括接入设备740,接入设备740使得计算设备700能够经由一个或多个网络760通信。这些网络的示例包括公用交换电话网(pstn,public switched telephone network)、局域网(lan,localareanetwork)、广域网(wan,widearea network)、个域网(pan,personalareanetwork)或诸如因特网的通信网络的组合。接入设备740可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(nic,network interface card))中的一个或多个,诸如ieee802.11无线局域网(wlan,wireless localarea networks)无线接口、全球微波互联接入(wi-max,world interoperability for microwave access)接口、以太网接口、通用串行总线(usb,universal serial bus)接口、蜂窝网络接口、蓝牙接口、近场通信(nfc,near field communication)接口,等等。
[0161]
在本说明书的一个实施例中,计算设备700的上述部件以及图7中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图7所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
[0162]
计算设备700可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或pc的静止计算设备。计算设备700还可以是移动式或静止式的服务器。
[0163]
其中,处理器720用于执行如下计算机可执行指令,该计算机可执行指令被处理器执行时实现上述文本纠错方法的步骤或文本纠错词库构建方法的步骤。
[0164]
上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技
术方案与上述的文本纠错方法或文本纠错词库构建方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述文本纠错方法或文本纠错词库构建方法的技术方案的描述。
[0165]
本说明书一实施例还提供一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现上述文本纠错方法的步骤或文本纠错词库构建方法的步骤。
[0166]
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的文本纠错方法或文本纠错词库构建方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述文本纠错方法或文本纠错词库构建方法的技术方案的描述。
[0167]
本说明书一实施例还提供一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述文本纠错方法的步骤或文本纠错词库构建方法的步骤。
[0168]
上述为本实施例的一种计算机程序的示意性方案。需要说明的是,该计算机程序的技术方案与上述的文本纠错方法或文本纠错词库构建方法的技术方案属于同一构思,计算机程序的技术方案未详细描述的细节内容,均可以参见上述文本纠错方法或文本纠错词库构建方法的技术方案的描述。
[0169]
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
[0170]
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,randomaccess memory)、电载波信号、电信信号以及软件分发介质等。
[0171]
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本说明书实施例并不受所描述的动作顺序的限制,因为依据本说明书实施例,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本说明书实施例所必须的。
[0172]
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
[0173]
以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书实施例的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本说明书实施例的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。

技术特征:


1.一种文本纠错方法,包括:接收客户端发送的当前会话的文本编辑消息;对所述文本编辑消息进行解析,获得所述当前会话下生成的纠错词对;获得实时语音识别文本,利用所述纠错词对,对所述实时语音识别文本进行纠错,得到修正文本;将所述修正文本发送至所述客户端进行显示。2.根据权利要求1所述的方法,所述文本编辑消息包括编辑前的原始文本片段和编辑后的目标文本片段;所述对所述文本编辑消息进行解析,获得所述当前会话下生成的纠错词对,包括:对所述原始文本片段和所述目标文本片段进行文本对齐和分词处理,得到所述原始文本片段的第一分词序列和所述目标文本片段的第二分词序列;基于所述第一分词序列和所述第二分词序列,确定纠错词对。3.根据权利要求1或2所述的方法,在所述对所述文本编辑消息进行解析,获得所述当前会话下生成的纠错词对之前,还包括:获取编辑前的原始文本片段的第一文本长度、编辑后的目标文本片段的第二文本长度;根据所述第一文本长度和所述第二文本长度,计算文本长度差;所述对所述文本编辑消息进行解析,获得所述当前会话下生成的纠错词对,包括:在所述文本长度差未超过预设阈值的情况下,对所述文本编辑消息进行解析,获得所述当前会话下生成的纠错词对。4.根据权利要求1或2所述的方法,在所述对所述文本编辑消息进行解析,获得所述当前会话下生成的纠错词对之后,还包括:将所述纠错词对存储至所述当前会话的文本纠错词库;所述利用所述纠错词对,对所述实时语音识别文本进行纠错,得到修正文本,包括:从所述文本纠错词库中读取所述纠错词对,利用所述纠错词对,对所述实时语音识别文本进行纠错,得到修正文本。5.根据权利要求4所述的方法,所述文本编辑消息包括用户标识;在所述将所述纠错词对存储至所述当前会话的文本纠错词库之后,还包括:在达到预设触发条件的情况下,从所述文本纠错词库中提取目标纠错词对;将所述目标纠错词对存储至所述用户标识对应的用户数据库中。6.根据权利要求5所述的方法,还包括:从所述文本纠错词库或所述用户数据库中,获取历史纠错词对;将所述当前会话下生成的纠错词对与所述历史纠错词对进行冲突分析;如果存在冲突,则删除所述历史纠错词对。7.根据权利要求1所述的方法,所述接收客户端发送的当前会话的文本编辑消息,包括:接收客户端在预设间隔时间内发送的多个文本编辑消息;整合所述多个文本编辑消息,得到当前会话的文本编辑消息。8.根据权利要求1所述的方法,所述纠错词对包括目标原词和候选词;
所述利用所述纠错词对,对所述实时语音识别文本进行纠错,得到修正文本,包括:获取所述纠错词对对应的编辑后的目标文本片段;根据所述纠错词对,对所述实时语音识别文本中的所述目标原词进行掩码处理,得到目标处理文本;将所述目标处理文本和所述目标文本片段输入预训练的语义纠错模型,得到所述目标处理文本中掩码位置处是所述目标原词的第一概率、是所述候选词的第二概率;在所述第一概率和所述第二概率达到预设替换条件的情况下,将所述实时语音识别文本中的所述目标原词替换为所述候选词,得到修正文本。9.一种文本纠错词库构建方法,包括:获取当前会话的文本编辑消息;对所述文本编辑消息进行解析,获得所述当前会话下生成的纠错词对;将所述纠错词对存储至所述当前会话的文本纠错词库,所述文本纠错词库用于对待纠错文本进行纠错。10.一种文本纠错装置,包括:接收模块,被配置为接收客户端发送的当前会话的文本编辑消息;第一解析模块,被配置为对所述文本编辑消息进行解析,获得所述当前会话下生成的纠错词对;纠错模块,被配置为获得实时语音识别文本,利用所述纠错词对,对所述实时语音识别文本进行纠错,得到修正文本;发送模块,被配置为将所述修正文本发送至所述客户端进行显示。11.一种文本纠错词库构建装置,包括:获取模块,被配置为获取当前会话的文本编辑消息;第二解析模块,被配置为对所述文本编辑消息进行解析,获得所述当前会话下生成的纠错词对;存储模块,被配置为将所述纠错词对存储至所述当前会话的文本纠错词库,所述文本纠错词库用于对待纠错文本进行纠错。12.一种计算设备,包括:存储器和处理器;所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1至8任意一项所述文本纠错方法的步骤、或者权利要求9所述文本纠错库构建方法的步骤。13.一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1至8任意一项所述文本纠错方法的步骤、或者权利要求9所述文本纠错库构建方法的步骤。

技术总结


本说明书实施例提供了文本纠错及文本纠错词库构建方法,其中文本纠错方法包括:接收客户端发送的当前会话的文本编辑消息,对文本编辑消息进行解析,获得当前会话下生成的纠错词对,获得实时语音识别文本,利用纠错词对,对实时语音识别文本进行纠错,得到修正文本,将修正文本发送至客户端进行显示。由于纠错词对是用户在客户端进行文本编辑时产生的,则在对后续接收的实时语音识别文本进行纠错时,符合用户的实际编辑需求,实现了定制化的文本纠错,并且,用户一次文本编辑,在后续的语音识别中都可以快速纠错,提高了对语音识别文本纠错的效率和准确度。的效率和准确度。的效率和准确度。


技术研发人员:

曹迪 邓憧

受保护的技术使用者:

阿里巴巴(中国)有限公司

技术研发日:

2022.02.11

技术公布日:

2022/6/17

本文发布于:2024-09-22 12:44:00,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/2497.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:文本   文本编辑   所述   词库
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议