一种文本语义识别方法、装置、电子终端及存储介质与流程



1.本发明实施例涉及自然语言处理技术,尤其涉及一种文本语义识别方法、装置、电子终端及存储介质。


背景技术:



2.文本语义识别可广泛应用于金融、通信、电子商务等领域的机器人智能对话服务中。现有技术中,基于模型进行文本语义识别主要涉及短文本的单一意图识别。然而,在实际应用中,往往存在对长文本进行多意图、多粒度语义的精准识别的需求。
3.基于现有模型进行文本语义识别,容易出现将长本文直接截断识别的情况,导致语义识别精度低。此外,现有模型也难以实现多意图、多粒度的语义识别。因此,亟需一种文本语义识别方法来解决现有技术中难以对长本文进行多意图、多粒度语义的精准识别的技术问题。


技术实现要素:



4.有鉴于此,本发明实施例提供了一种文本语义识别方法、装置、电子终端及存储介质,能够实现对长文本进行多意图、多粒度语义的精准识别。
5.第一方面,本发明实施例提供了一种文本语义识别方法,包括:
6.通过第一阶段模型判断原始文本中的各句子片段是否与至少一个意图标签相关;
7.将所述原始文本中与所述至少一个意图标签相关的句子片段依序组成中间文本;
8.获取与所述中间文本相关的至少一个意图标签对应的至少一个原因标签;
9.通过第二阶段模型预测所述中间文本针对所述至少一个原因标签的情感标签;
10.根据预测出的所述情感标签,从所述至少一个原因标签中确定目标原因标签。
11.第二方面,本发明实施例还提供了一种文本语义识别装置,包括:
12.相关意图判断模块,用于通过第一阶段模型判断原始文本中的各句子片段是否与至少一个意图标签相关;
13.文本筛选模块,用于将所述原始文本中与所述至少一个意图标签相关的句子片段依序组成中间文本;
14.原因标签获取模块,用于获取与所述中间文本相关的至少一个意图标签对应的至少一个原因标签;
15.情感标签预测模块,用于通过第二阶段模型预测所述中间文本针对所述至少一个原因标签的情感标签;
16.目标原因确定模块,用于根据预测出的所述情感标签,从所述至少一个原因标签中确定目标原因标签。
17.第三方面,本发明实施例还提供了一种电子终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本技术任意实施例提供的文本语义识别方法。
18.第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如本技术任意实施例提供的文本语义识别方法。
19.本发明实施例提供的一种文本语义识别方法、装置、电子终端及存储介质,该文本语义识别方法包括:通过第一阶段模型判断原始文本中的各句子片段是否与至少一个意图标签相关;将原始文本中与至少一个意图标签相关的句子片段依序组成中间文本;获取与中间文本相关的至少一个意图标签对应的至少一个原因标签;通过第二阶段模型预测中间文本针对至少一个原因标签的情感标签;根据预测出的情感标签,从至少一个原因标签中确定目标原因标签。
20.通过第一阶段模型能够对较长原始文本进行预处理,从原始文本中筛选出与至少一个意图标签相关的中间文本,可压缩文本长度、增强信息效度,避免文本直接截断识别的情况,可提高识别精度。通过第二阶段模型能够对各相关意图标签粒度下更细的原因标签粒度进行识别,预测出各原因标签对应的情感标签,进而可依据情感标签确定出目标原因标签。综上,本发明实施例提供的技术方案,可实现对长文本进行多意图、多粒度语义的精准识别。
附图说明
21.图1是本发明实施例一提供的一种文本语义识别方法的流程示意图;
22.图2是本发明实施例二提供的一种文本语义识别方法中确定中间文本的流程框图;
23.图3是本发明实施例二提供的一种文本语义识别方法中第一阶段模型的处理流程框图;
24.图4是本发明实施例三提供的一种文本语义识别方法中预测情感标签的流程框图;
25.图5是本发明实施例三提供的一种文本语义识别方法中第二阶段模型的处理流程框图;
26.图6是本发明实施例四提供的一种文本语义识别方法的流程示意图;
27.图7是本发明实施例五提供的一种文本语义识别装置的结构示意图;
28.图8是本发明实施例六提供的一种电子终端的结构示意图。
具体实施方式
29.下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。下述各实施例中,每个实施例中同时提供了可选特征和示例,实施例中记载的各个特征可进行组合,形成多个可选方案,不应将每个编号的实施例仅视为一个技术方案。
30.实施例一
31.图1是本发明实施例一提供的一种文本语义识别方法的流程示意图。本实施例可
适用于对文本进行多意图、多粒度语义识别的情况,例如可适用于对邮件等长文本进行多意图、多粒度语义识别的情况。该方法可以由本发明实施例提供的文本语义识别装置来执行,该装置可采用软件和/或硬件的方式实现,且可配置于电子终端中,例如配置于计算机中。
32.参见图1,本实施例提供的文本语义识别方法,可以包括:
33.s110、通过第一阶段模型判断原始文本中的各句子片段是否与至少一个意图标签相关。
34.本发明实施例中,原始文本可以用sc={char1,char2,

,char
c_n
}表示,其中char可表示字符,其下标可表示字符排序,c_n可表示原始文本包含的字符总数;可以通过已有的分词方法(例如jieba分词软件)将原始文本sc进行分词,得到原始文本在词维度上的表示sw={word1,word2,

,word
w_n
},其中word可表示词语,其下标可表示词语排序,w_n可表示原始文本包含的词语总数;之后可通过已有的分句方法(例如深度学习算法)对sw进行分句,得到原始文本在句子维度上的表示ss={sent1,sent2,

,sent
s_n
},其中sent可表示句子片段,其下标可表示句子片段的排序,s_n可表示原始文本包含的句子片段的总数。
35.本发明实施例中,意图标签可以认为是粗粒度的语义标签,可用于描述原始文本包含的意图。其中,至少一个意图标签可以用ca={ca1,ca2,

,ca
p
}表示;其中ca可表示意图标签,其下标可表示意图标签的序号,p可表示意图标签的总数。
36.其中,可预先根据原始文本的来源,设置至少一个意图标签。例如,当原始文本源于电子商务领域时,可设置ca={退货,投诉,退款,询问,其他}。
37.第一阶段模型可以为训练完成的神经网络模型。第一阶段模型在训练过程中使用的第一样本数据可以与原始文本的来源相同。可以根据第一样本数据的各句子片段,以及与各句子片段对应的意图标签的标注数据对第一阶段模型进行预先训练。从而,通过训练完成的第一阶段模型可以判断原始文本中的各句子片段是否与至少一个意图标签相关,以实现对各句子片段进行粗粒度方面的分类。
38.当原始文本为长文本的情况下,其包含的信息较为丰富。原始文本的不同句子片段可以与不同的意图标签相关,也可以与相同的意图标签相关。可以认为,通过第一阶段模型可以识别出与原始文本相关的一个或多个意图标签,从而可实现文本的多意图识别。
39.s120、将原始文本中与至少一个意图标签相关的句子片段依序组成中间文本。
40.其中,若原始文本中的句子片段与至少一个意图标签中任一标签相关,则可将句子片段保留;若原始文本中的句子片段与每个意图标签都不相关,则可以将句子片段进行去除。
41.由于原始文本中存在内在的语序逻辑,可将筛选后保留下来的句子片段按照其在原始文本中的先后排序进行重新拼接组合,生成中间文本。本发明实施例中,中间文本可以表示为sf={sf1,sf2,

,sfm},其中sf可表示保留下来的句子片段,其下标可表示句子片段在中间文本中的新的排序,m可表示中间文本包含的句子片段的总数,且m≤s_n,即sf为ss的子集。
42.通过对原始文本进行筛选,保留下与意图标签相关的文本,可压缩原始文本的长度、增强信息效度。从而在原始文本为长文本时,可避免直接截断识别的情况,提高识别精度,以实现在长文本方面的语义识别。
43.s130、获取与中间文本相关的至少一个意图标签对应的至少一个原因标签。
44.本发明实施中,每个意图标签下可以对应至少一个原因标签。原因标签可以认为是粗粒度语义标签下的细粒度语义标签,可主要描述产生意图的原因。其中,每个意图标签下对应的至少一个原因标签可以用fa={fa1,fa2,

,faq}表示;其中fa可表示原因标签,其下标可表示原因标签的序号,q可表示所属意图标签下原因标签的总数。
45.同样可根据原始文本的来源,预先设置每个意图标签下的至少一个原因标签。例如,当原始文本源于电子商务领域,且意图标签为“退款”时,可设置fa={是否破损,是否错发、漏发,是否需要维修,是否与描述相符,是否按时发货,是否存在其他问题}。
46.本发明实施例中,与中间文本相关的至少一个意图标签,可认为同于与原始文本相关的一个或多个意图标签。可根据预先设置,读取每个相关的意图标签下对应的至少一个原因标签。例如,当相关的意图标签包括“退款”和“投诉”时,可分别读取“退款”下的至少一个原因标签,以及读取“投诉”下的至少一个原因标签。
47.s140、通过第二阶段模型预测中间文本针对至少一个原因标签的情感标签。
48.本发明实施例中,情感标签可认为是细粒度的语义标签,可用于描述文本中针对原因标签表征原因的态度情绪。情感标签可以根据具体应用场景设置多个分类等级。例如,电子商务领域中情感标签可以设置为四类,分别为“未提及”,“中性”,“积极”和“消极”。
49.其中,第二阶段模型也可以为训练完成的神经网络模型。第二阶段模型在训练过程中使用的第二样本数据可以包括,训练完成的第一阶段模型根据第一样本数据输出的中间文本及其对应的原因标签。可以根据第二样本数据以及各第二样本数据对应的情绪标签的标注数据对第二阶段模型进行预先训练。其中,为了便于第二阶段模型训练学习,可以为各类情感标签设置对应的标注数值,例如“未提及”可标注为-2,“中性”可标注为0,“积极”可标注为1,“消极”可标注为-1。
50.从而,通过训练完成的第二阶段模型可以预测原始文本对应的中间文本中,针对至少一个原因标签的情感标签。
51.s150、根据预测出的情感标签,从至少一个原因标签中确定目标原因标签。
52.针对不同应用场景,造成原始文本中意图的根本原因的态度情绪往往不同。例如,在表彰场景中,造成“表彰”意图的根本原因对应的态度情绪是积极的;在投诉场景中,造成“投诉”意图的根本原因对应的态度情绪是消极的。因此,可根据不同应用场景,预先设置表征造成意图的根本原因对应的目标情感标签。
53.相应的,当预测出的情感标签属于目标情感标签时,可将对应的原因标签确定为目标原因标签。其中,目标原因标签的数量可以为至少一个。例如,在电子商务领域,意图标签为“退款”时,目标情感标签可以为“消极”。当“是否破损”和“是否错发、漏发”这两个原因标签对应的情感标签皆为“消极”时,可将该两个原因标签皆作为目标原因标签。
54.通过预测相关意图标签下至少一个原因标签对应的情感标签,可实现对原始文本在目标原因标签维度的细粒度语义识别,充分提取了各粒度的语义特征,提高了文本情感分类任务的性能。从而可以实现对文本的多意图、多粒度的语义识别。
55.本发明实施例提供的一种文本语义识别方法,通过第一阶段模型判断原始文本中的各句子片段是否与至少一个意图标签相关;将原始文本中与至少一个意图标签相关的句子片段依序组成中间文本;获取与中间文本相关的至少一个意图标签对应的至少一个原因
标签;通过第二阶段模型预测中间文本针对至少一个原因标签的情感标签;根据预测出的情感标签,从至少一个原因标签中确定目标原因标签。
56.通过第一阶段模型能够对较长原始文本进行预处理,从原始文本中筛选出与至少一个意图标签相关的中间文本,可压缩文本长度、增强信息效度,避免文本直接截断识别的情况,可提高识别精度。通过第二阶段模型能够对各相关意图标签粒度下更细的原因标签粒度进行识别,预测出各原因标签对应的情感标签,进而可依据情感标签确定出目标原因标签。综上,本发明实施例提供的技术方案,可实现对长文本进行多意图、多粒度语义的精准识别。
57.实施例二
58.本实施例提供的文本语义识别方法,能够与上述实施例中所提供的文本语义识别方法中各个可选方案相结合。本实施例提供的生文本语义识别方法,对中间文本的确定步骤进行了详细描述。通过依次将各句子片段和每个意图标签的组合输入第一阶段模型中判断各句子片段是否与任一意图标签相关,可实现根据相关的句子片段生成中间文本。
59.图2是本发明实施例二提供的一种文本语义识别方法中确定中间文本的流程框图。参见图2,本实施例提供的文本语义识别方法,通过第一阶段模型判断原始文本中的各句子片段是否与至少一个意图标签相关,可以包括:
60.依次获取原始文本ss中的各句子片段。例如,为保证原始文本语序,可以按照句子片段sent下标由小到大的顺序依次选取句子片段。可认为,本发明各实施例中相同字符指代内容相同,例如本实施与实施例一中原始文本在句子维度上的表示皆可用字符ss指代,以此类推。
61.将当前获取的句子片段senti和意图标签组ca输入第一阶段模型;意图标签组中包含至少一个意图标签。其中,可以将senti与ca的组合{senti,ca}输入至第一阶段模型。其中,第一阶段模型例如可以为图2中的张量融合模型(tensor fusion network,tfn),此外也可以为其他已有的分类模型,在此不做穷举。
62.通过第一阶段模型对当前获取的句子片段和意图标签组进行处理,输出当前获取的句子片段与至少一个意图标签是否相关。其中,若判断senti与ca中某意图标签相关,则tfn模型可对应输出1;若判断senti与ca中某意图标签都不相关,则tfn模型可对应输出0。可认为tfn模型可输出一组包含0和/或1的数组,且数组中每个数值可以与一个意图标签对应。若输出的数组中包含1,则可认为当前获取的句子片段与至少一个意图标签相关。
63.之后,可将原始文本中与至少一个意图标签相关的句子片段依序组成中间文本sf。
64.示例性的,图3是本发明实施例二提供的一种文本语义识别方法中第一阶段模型的处理流程框图。参见图3,在一些可选的实施方式中,通过第一阶段模型对当前获取的句子片段和意图标签组进行处理,包括:
65.首先,通过第一阶段模型,将当前获取的句子片段中各词语转化为各第一词向量,以及将意图标签组中各意图标签转化为各第二词向量。
66.第一阶段模型可以包含词嵌入层,且词嵌入层可以为已有的文字转向量的模型(例如word2vec模型等)。其中,可在原始语料库上预先训练出一个领域相关的文字转向量模型以作为词嵌入层的模型参数,且模型参数大小可以为v
×
d,其中v可表示词汇表的大
小,d可表示词嵌入的维度。
67.假设句子片段中包含l个词语,即输入词嵌入层的句子片段的大小为1
×
l;意图标签组中包含c个意图标签(每个意图标签可以看做一个词语),即输入词嵌入层的意图标签的大小为1
×
c。相应的,词嵌入层输出的各第一词向量的大小可以为l
×
d,输出的各第二词向量的大小可以为c
×
d。
68.其次,根据各第一词向量确定句子片段的句嵌入向量,以及根据各第二词向量确定意图标签组的标签组嵌入向量。
69.第一阶段模型还可以包括两个编码器,以用于分别将各第一词向量编码为句嵌入向量,将各第二词向量编码为标签组嵌入向量。其中,两个编码器可以为相同种类的编码器,也可以为不同种类的编码器。例如,图3中两个编码器可皆为长短期记忆模型(long short-term memory,lstm)。其中,当两个编码器为相同种类的编码器时,其包含的网络参数可以存在差异。
70.通过两个lstm模型可以分别对各第一词向量和各第二词向量建模,分别得到大小为h
×
l和h
×
c的对应嵌入向量,其中h可表示lstm模型的隐藏层的维度。
71.再次,根据句嵌入向量和标签组嵌入向量,确定句子片段与意图标签组之间的第一注意力权重。
72.第一阶段模型还可以包括池化层、注意力层和注意力分数层。通过池化层(例如图3中的均值池化层)可将标签组嵌入向量池化为大小为h
×
1的第一张量。其中注意力层可以为预先训练的注意力模型。注意力层可利用注意力机制,根据输入的第一张量以及句嵌入向量,确定大小为h
×
1的初始注意力权重。为了提高普适性,可利用注意力分数层将初始注意力权重进行归一化,得到大小为1
×
l的第一注意力权重。
73.接着,利用第一注意力权重对句嵌入向量进行处理,确定目标特征向量。
74.第一阶段模型还可以包括加权相乘层。通过加权相乘层可以将句嵌入向量与第一注意力权重加权相乘,得到大小为h
×
1的第二张量。通过将第一张量和第二张量进行融合,可以得到目标特征向量。
75.最后,根据目标特征向量判断当前获取的句子片段与至少一个意图标签是否相关。
76.第一阶段模型还可以包括分类器(例如sigmod分类器等)。通过分类器可根据输入的目标特征向量输出一组包含0和/或1的数组,且数组中每个数值可以与一个意图标签对应。若输出的数组中包含1,则可认为当前获取的句子片段与至少一个意图标签相关。
77.本发明实施例提供的文本语义识别方法,对中间文本的确定步骤进行了详细描述。通过依次将各句子片段和每个意图标签的组合输入第一阶段模型,可判断各句子片段是否与任一意图标签相关,从而可根据相关的句子片段生成中间文本。此外,本实施例提供的文本语义识别方法与上述实施例提供的文本语义识别方法属于同一技术构思,未在本实施例中详尽描述的技术细节可参见上述实施例,并且相同的技术特征在本实施例与上述实施例中具有相同的有益效果。
78.实施例三
79.本实施例提供的文本语义识别方法,能够与上述实施例中所提供的文本语义识别方法中各个可选方案相结合。本实施例提供的生文本语义识别方法,对情感标签的预测步
骤进行了详细描述。通过将中间文本与各相关意图下的各原因标签构成句子对输入第二阶段模型中,可实现对各原因标签的情感标签的预测。
80.图4是本发明实施例三提供的一种文本语义识别方法中预测情感标签的流程框图。参见图4,本实施例提供的文本语义识别方法,通过第二阶段模型预测中间文本针对至少一个原因标签的情感标签,可以包括:
81.将中间文本sf和至少一个原因标签fag输入第二阶段模型。
82.其中,可以将中间文本sf和每个原因标签fag的句子对进行拼接并输入第二阶段模型。其中,第二阶段模型可以为先在大型的语料库上进行预训练后,再在细分的自然语言处理任务上进行微调的语言表征模型。例如,第二阶段模型可以为改进后的基于transformer的双向编码表征(bidirectional encoder representation from transformers,bert)模型,图4中可称为bert-pair-att模型。此外,第二阶段模型也可以为其他已有的语言表征模型,在此不做穷举。
83.其中,第二阶段模型的输入数据采用了句子对的形式。这种数据形式中,第一个文本可以为sf,第二个文本可以为相关ca下的每个fag。其中,第二个文本可以设置为疑问句的形式,例如相关ca“退货”下的某个fag可以为“收到商品是否破损”。通过构造疑问句的方式来处理文本分类任务,可使第二阶段模型的性能得到显著地提升。
84.通过第二阶段模型对中间文本和至少一个原因标签进行处理,输出中间文本针对至少一个原因标签的情感标签。
85.其中,基于bert-pair-att模型可预测每个原因标签fag对应的情感标签。且每个原因标签对应的情感标签,可以为“未提及”,“消极”,“中性”和“积极”中的一种。
86.示例性的,图5是本发明实施例三提供的一种文本语义识别方法中第二阶段模型的处理流程框图。参见图5,在一些可选的实施方式中,通过第二阶段模型对中间文本和至少一个原因标签进行处理,可以包括:
87.首先,通过第二阶段模型,将中间文本和至少一个原因标签分别进行组合编码,得到第一特征图像。
88.第二阶段模型可以为bert-pair-att模型,且可包括编码层、注意力层、全连接层等。可通过编码层对输入的sf和每个原因标签fag的句子对进行编码,得到第一特征图像。
89.其次,确定第一特征图像中各元素的第二注意力权重。
90.与传统的bert
base
模型的模型结构相比,bert-pair-att模型中包括了注意力层。其中,可以预先随机初始化bert-pair-att模型中注意力层的两个矩阵w1∈r
b*b
和w2∈r
b*1
,b可表示bert-pair-att模型的隐层维度。w1和w2在bert-pair-att模型训练过程中可不断调整,以学习第一特征图像上不同位置特征对于情感标签分类的任务对应的价值大小。
91.训练完成的bert-pair-att模型,通过注意力层利用注意力机制,可对第一特征图像中所有位置的元素进行处理确定第二注意力权重。示例性的,第二注意力权重score可通过公式score=softmax(tanh(eb*w1)*w2)确定,其中eb可表示第一特征图像,且eb∈r
l*b
,其中l可表示获取的原因标签的总数。
92.接着,利用第二注意力权重对第一特征图像进行处理,得到第二特征图像。其中,可通过下述公式确定第二特征图像:
[0093][0094]
其中,可表示第一特征图像中第i个原因标签对应的特征,scorei可表示第二注意力权重中第i个原因标签对应的权重。通过各原因标签对应的特征和权重相乘并相加,可以得到第二特征图像feature。通过增加注意力层,可以实现对第一特征图像不同位置特征赋予不同的权重,从而可提高情感标签分类精度。
[0095]
最后,根据第二特征图像预测中间文本针对获取的原因标签的情感标签。其中,可通过第二阶段模型中的全连接层实现各情感标签输出,且全连接层的处理步骤可通过下述公式表示:
[0096]
label=softmax(feature*w3+b1);
[0097]
其中,w3可表示全连接层的权重,b1可表示全连接层的偏置,这两个参数可通过第二阶段模型训练确定。其中,全连接层可以为softmax层。其中,若情感标签分为4类,则w3∈r
b*4
。通过全连接层可输出每个原因标签fag对应的情感标签label。
[0098]
本发明实施例提供的文本语义识别方法,对情感标签的预测步骤进行了详细描述。通过将中间文本与各相关意图下的各原因标签构成句子对输入第二阶段模型中,可实现对各原因标签的情感标签的预测。此外,本实施例提供的文本语义识别方法与上述实施例提供的文本语义识别方法属于同一技术构思,未在本实施例中详尽描述的技术细节可参见上述实施例,并且相同的技术特征在本实施例与上述实施例中具有相同的有益效果。
[0099]
实施例四
[0100]
本实施例提供的文本语义识别方法,能够与上述实施例中所提供的文本语义识别方法中各个可选方案相结合。本实施例提供的生文本语义识别方法,对应用场景进行了详细描述。在本实施例的实现方式中,原始文本可以包括对话文本。其中,对话文本可以包括但不限于邮件正文、用户输入的与智能机器人的文字等等。此时,在精准识别对话文本的意图标签、情感标签和目标原因标签后,还可匹配准确性高、可用性高的模板来进行回复,以提升对方的对话体验。
[0101]
图6是本发明实施例四提供的一种文本语义识别方法的流程示意图。参见图6,本实施例提供的文本语义识别方法,可以包括:
[0102]
s610、通过第一阶段模型判断对话文本中的各句子片段是否与至少一个意图标签相关。
[0103]
本实施例中,对话文本可以为跨境电商场景下甲方用户向乙方用户发送邮件的邮件正文。此时,至少一个意图标签可以包括“退货”、“投诉”、“退款”、“询问”和“其他”这五个意图标签。其中,针对邮件类型的长文本,关键在于长文本的压缩。本实施例中,可通过第一阶段模型对对话文本进行筛选,以得到与意图标签相关的句子片段。
[0104]
s620、将对话文本中与至少一个意图标签相关的句子片段依序组成中间文本。
[0105]
s630、获取与中间文本相关的至少一个意图标签对应的至少一个原因标签。
[0106]
本实施例中,可以预设“退货”、“投诉”、“退款”、“询问”和“其他”这五个意图标签分别对应的至少一个原因标签。并可以在确定与中间文本相关的至少一个意图标签后,从预设原因标签中选出相关意图标签下的各原因标签。
[0107]
s640、通过第二阶段模型预测中间文本针对至少一个原因标签的情感标签。
[0108]
本实施例中,可以预设“未提及”,“中性”,“积极”和“消极”这四类情感标签,且目标情感标签可以设置为“消极”。
[0109]
s650、根据预测出的情感标签,从至少一个原因标签中确定目标原因标签。
[0110]
本实施例中,如果某原因标签对应的情感标签为目标原因标签(即“消极”),那么可将该原因标签确定为目标原因标签。
[0111]
s660、根据与中间文本相关的至少一个意图标签、预测出的情感标签以及目标原因标签,从预设模板库中匹配出目标模板。
[0112]
预测出的情感标签除包含“消极”外,也存在包含“积极”等其他情感标签的可能性。在匹配目标模板时,可针对预测出的各情感标签进行相应模板匹配。例如,可针对“积极”对应的原因标签方面表示感谢,针对“消极”对应的原因标签方面进行情绪上的安抚。同时,也可针对意图标签和目标原因标签匹配合适的处理措施,以实现精准、可用的回复,提高甲方用户的对话体验。
[0113]
示例性的,表6提供了一组对话文本、意图标签、原因标签和情感标签的样例。
[0114]
表6
[0115][0116]
参见表6,对话文本为邮件正文;通过第一阶段模型识别确定相关的意图标签为“退款”;通过第二阶段模型预测出“退款”意图下各原因标签对应的情感标签。其中,“退款”意图下的原因标签,可以包括“是否破损”,“是否错发、漏发”,“是否需要维修”,“是否与描述相符”,“是否按时发货”和“是否存在其他问题”六种原因标签。其中,情感标签中-2可表示“未提及”,0可表示“中性”,1可表示“积极”,-1可表示“消极”。由预测出的各情感标签可知,在“退款”意图标签下,目标原因标签包括“有破损”及“与描述不符”,且并未提及其他方面。
[0117]
在表6的场景下,可根据意图标签“退款”,情感标签“消极”和目标原因标签“有破损”及“与描述不符”来匹配目标模板。例如,可分别根据(“退款”,“有破损”,“消极”)和(“退款”,“与描述不符”,“消极”)这两个三元组匹配目标模板,并将两个目标模板合并。
[0118]
s670、基于目标模板对对话文本进行回复。
[0119]
其中,可直接利用目标模板进行回复。
[0120]
此外,在一些可选的实施方式中,基于目标模板对对话文本进行回复,也可以包括:响应于修改指令对目标模板进行修改,得到回复文本;其中回复文本用于对预设模板库
进行更新;将回复文本发送至对话文本的发送端。
[0121]
在实际应用过程中,存在预设模板库中的模板皆不匹配的情况,此时可以匹配较为相似的模板作为目标模板。并且可根据乙方用户输入的修改指令对目标目标进行修改,得到可用的回复文本。之后,可将回复文本发送至对话文本的发送端,即回复给甲方用户的客户端。
[0122]
在这些可选的实现方式中,预设模板库还可以根据回复文本进行不断更新,从而可以使预设模板库更加丰富,提高后续匹配的目标模板的准确性、可用性。
[0123]
本发明实施例提供的文本语义识别方法,对应用场景进行了详细描述。在本实施例的实现方式中,原始文本可以包括对话文本。其中,对话文本可以包括但不限于邮件正文、用户输入的与智能机器人的文字等等。此时,在精准识别对话文本的意图标签、情感标签和目标原因标签后,还可匹配准确性高、可用性高的模板来进行回复,以提升对方的对话体验。此外,本实施例提供的文本语义识别方法与上述实施例提供的文本语义识别方法属于同一技术构思,未在本实施例中详尽描述的技术细节可参见上述实施例,并且相同的技术特征在本实施例与上述实施例中具有相同的有益效果。
[0124]
实施例五
[0125]
图7是本发明实施例五提供的一种文本语义识别装置的结构示意图。本实施例可适用于对文本进行多意图、多粒度语义识别的情况,例如可适用于对邮件等长文本进行多意图、多粒度语义识别的情况。
[0126]
参见图7,本发明提供的文本语义识别装置,可以包括:
[0127]
相关意图判断模块710,用于通过第一阶段模型判断原始文本中的各句子片段是否与至少一个意图标签相关;
[0128]
文本筛选模块720,用于将原始文本中与至少一个意图标签相关的句子片段依序组成中间文本;
[0129]
原因标签获取模块730,用于获取与中间文本相关的至少一个意图标签对应的至少一个原因标签;
[0130]
情感标签预测模块740,用于通过第二阶段模型预测中间文本针对至少一个原因标签的情感标签;
[0131]
目标原因确定模块750,用于根据预测出的情感标签,从至少一个原因标签中确定目标原因标签。
[0132]
在一些可选的实施方式中,相关意图判断模块,可以用于:
[0133]
依次获取原始文本中的各句子片段;
[0134]
将当前获取的句子片段和意图标签组输入第一阶段模型;意图标签组中包含至少一个意图标签;
[0135]
通过第一阶段模型对当前获取的句子片段和意图标签组进行处理,输出当前获取的句子片段与至少一个意图标签是否相关。
[0136]
在一些可选的实施方式中,相关意图判断模块,可以用于:
[0137]
通过第一阶段模型,将当前获取的句子片段中各词语转化为各第一词向量,以及将意图标签组中各意图标签转化为各第二词向量;
[0138]
根据各第一词向量确定句子片段的句嵌入向量,以及根据各第二词向量确定意图
标签组的标签组嵌入向量;
[0139]
根据句嵌入向量和标签组嵌入向量,确定句子片段与意图标签组之间的第一注意力权重;
[0140]
利用第一注意力权重对句嵌入向量进行处理,确定目标特征向量;
[0141]
根据目标特征向量判断当前获取的句子片段与至少一个意图标签是否相关。
[0142]
在一些可选的实施方式中,情感标签预测模块,可以用于:
[0143]
将中间文本和至少一个原因标签输入第二阶段模型;
[0144]
通过第二阶段模型对中间文本和至少一个原因标签进行处理,输出中间文本针对至少一个原因标签的情感标签。
[0145]
在一些可选的实施方式中,情感标签预测模块,可以用于:
[0146]
通过第二阶段模型,将中间文本和至少一个原因标签分别进行组合编码,得到第一特征图像;
[0147]
确定第一特征图像中各元素的第二注意力权重;
[0148]
利用第二注意力权重对第一特征图像进行处理,得到第二特征图像;
[0149]
根据第二特征图像预测中间文本针对获取的原因标签的情感标签。
[0150]
在一些可选的实施方式中,原始文本包括对话文本;
[0151]
文本语义识别装置还可以包括:
[0152]
回复模块,用于在从至少一个原因标签中确定目标原因标签之后,根据与中间文本相关的至少一个意图标签、预测出的情感标签以及目标原因标签,从预设模板库中匹配出目标模板;
[0153]
基于目标模板对对话文本进行回复。
[0154]
在一些可选的实施方式中,回复模块,可以用于:
[0155]
响应于修改指令对目标模板进行修改,得到回复文本;其中回复文本用于对预设模板库进行更新;
[0156]
将回复文本发送至对话文本的发送端。
[0157]
本发明实施例所提供的文本语义识别装置可执行本发明实施例所提供的文本语义识别方法,具备执行方法相应的功能模块和有益效果。未详尽描述的技术细节,可参见本发明实施例所提供的文本语义识别方法。
[0158]
实施例六
[0159]
图8是本发明实施例六提供的一种电子终端的结构示意图。如图8所示,该终端可包括处理器810、存储器820、输入装置830和输出装置840;终端中处理器810的数量可以是一个或多个,图8中以一个处理器810为例;终端/中的处理器810、存储器820、输入装置830和输出装置840可以通过总线或其他方式连接,图8中以通过总线连接为例。
[0160]
存储器820作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的文本语义识别方法对应的程序指令/模块。处理器810通过运行存储在存储器820中的软件程序、指令以及模块,从而执行设备/终端/服务器的各种功能应用以及数据处理,即实现上述的文本语义识别方法。
[0161]
存储器820可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此
外,存储器820可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器820可进一步包括相对于处理器810远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0162]
输入装置830可用于接收输入的数字或字符信息,以及产生与终端的用户设置以及功能控制有关的键信号输入。输出装置840可包括显示屏等显示设备。
[0163]
实施例七
[0164]
本发明实施例七还提供一种包含计算机可执行指令的存储介质,计算机可执行指令在由计算机处理器执行时用于执行一种文本语义识别方法,该方法包括:
[0165]
通过第一阶段模型判断原始文本中的各句子片段是否与至少一个意图标签相关;将原始文本中与至少一个意图标签相关的句子片段依序组成中间文本;获取与中间文本相关的至少一个意图标签对应的至少一个原因标签;通过第二阶段模型预测中间文本针对至少一个原因标签的情感标签;根据预测出的情感标签,从至少一个原因标签中确定目标原因标签。
[0166]
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上的方法操作,还可以执行本发明任意实施例所提供的文本语义识别方法中的相关操作。
[0167]
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、闪存(flash)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例的方法。
[0168]
值得注意的是,上述搜索装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
[0169]
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

技术特征:


1.一种文本语义识别方法,其特征在于,包括:通过第一阶段模型判断原始文本中的各句子片段是否与至少一个意图标签相关;将所述原始文本中与所述至少一个意图标签相关的句子片段依序组成中间文本;获取与所述中间文本相关的至少一个意图标签对应的至少一个原因标签;通过第二阶段模型预测所述中间文本针对所述至少一个原因标签的情感标签;根据预测出的所述情感标签,从所述至少一个原因标签中确定目标原因标签。2.根据权利要求1所述的方法,其特征在于,所述通过第一阶段模型判断原始文本中的各句子片段是否与至少一个意图标签相关,包括:依次获取原始文本中的各句子片段;将当前获取的句子片段和意图标签组输入第一阶段模型;所述意图标签组中包含至少一个意图标签;通过所述第一阶段模型对所述当前获取的句子片段和所述意图标签组进行处理,输出所述当前获取的句子片段与所述至少一个意图标签是否相关。3.根据权利要求2所述的方法,其特征在于,所述通过所述第一阶段模型对所述当前获取的句子片段和所述意图标签组进行处理,包括:通过所述第一阶段模型,将所述当前获取的句子片段中各词语转化为各第一词向量,以及将所述意图标签组中各意图标签转化为各第二词向量;根据所述各第一词向量确定所述句子片段的句嵌入向量,以及根据所述各第二词向量确定所述意图标签组的标签组嵌入向量;根据所述句嵌入向量和所述标签组嵌入向量,确定所述句子片段与所述意图标签组之间的第一注意力权重;利用所述第一注意力权重对所述句嵌入向量进行处理,确定目标特征向量;根据所述目标特征向量判断所述当前获取的句子片段与所述至少一个意图标签是否相关。4.根据权利要求1所述的方法,其特征在于,所述通过第二阶段模型预测所述中间文本针对所述至少一个原因标签的情感标签,包括:将所述中间文本和所述至少一个原因标签输入第二阶段模型;通过所述第二阶段模型对所述中间文本和所述至少一个原因标签进行处理,输出所述中间文本针对所述至少一个原因标签的情感标签。5.根据权利要求4所述的方法,其特征在于,所述通过所述第二阶段模型对所述中间文本和所述至少一个原因标签进行处理,包括:通过所述第二阶段模型,将所述中间文本和所述至少一个原因标签分别进行组合编码,得到第一特征图像;确定所述第一特征图像中各元素的第二注意力权重;利用所述第二注意力权重对所述第一特征图像进行处理,得到第二特征图像;根据所述第二特征图像预测所述中间文本针对所述获取的原因标签的情感标签。6.根据权利要求1-5中任一所述的方法,其特征在于,所述原始文本包括对话文本;在所述从所述至少一个原因标签中确定目标原因标签之后,还包括:根据与所述中间文本相关的至少一个意图标签、预测出的所述情感标签以及所述目标
原因标签,从预设模板库中匹配出目标模板;基于所述目标模板对所述对话文本进行回复。7.根据权利要求6所述的方法,其特征在于,所述基于所述目标模板对所述对话文本进行回复,包括:响应于修改指令对所述目标模板进行修改,得到回复文本;其中所述回复文本用于对所述预设模板库进行更新;将所述回复文本发送至所述对话文本的发送端。8.一种文本语义识别装置,其特征在于,包括:相关意图判断模块,用于通过第一阶段模型判断原始文本中的各句子片段是否与至少一个意图标签相关;文本筛选模块,用于将所述原始文本中与所述至少一个意图标签相关的句子片段依序组成中间文本;原因标签获取模块,用于获取与所述中间文本相关的至少一个意图标签对应的至少一个原因标签;情感标签预测模块,用于通过第二阶段模型预测所述中间文本针对所述至少一个原因标签的情感标签;目标原因确定模块,用于根据预测出的所述情感标签,从所述至少一个原因标签中确定目标原因标签。9.一种电子终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中任一所述的文本语义识别方法。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的文本语义识别方法。

技术总结


本发明实施例公开了一种文本语义识别方法、装置、电子终端及存储介质,该方法包括:通过第一阶段模型判断原始文本中的各句子片段是否与至少一个意图标签相关;将所述原始文本中与所述至少一个意图标签相关的句子片段依序组成中间文本;获取与所述中间文本相关的至少一个意图标签对应的至少一个原因标签;通过第二阶段模型预测所述中间文本针对所述至少一个原因标签的情感标签;根据预测出的所述情感标签,从所述至少一个原因标签中确定目标原因标签。能够实现对长文本进行多意图、多粒度语义的精准识别。语义的精准识别。语义的精准识别。


技术研发人员:

徐义通 郭林海 张琛 万化

受保护的技术使用者:

上海浦东发展银行股份有限公司

技术研发日:

2022.10.31

技术公布日:

2022/12/16

本文发布于:2024-09-25 12:32:00,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/35533.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:标签   文本   意图   所述
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议