概率预测模型训练方法、概率预测方法及装置[发明专利]

(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 (43)申请公布日 (21)申请号 202010399572.7
(22)申请日 2020.05.12
(71)申请人 北京三快在线科技有限公司
地址 100083 北京市海淀区北四环西路9号
2106-030
(72)发明人 步佳昊 杨扬 李勇 王金刚 
周翔 张富峥 陈胜 仙云森 
王仲远 
(74)专利代理机构 北京润泽恒知识产权代理有
限公司 11319
代理人 任亚娟
(51)Int.Cl.
G06F  16/242(2019.01)
G06F  16/2458(2019.01)
G06F  16/953(2019.01)
G06K  9/62(2006.01)G06Q  10/04(2012.01)G06Q  30/06(2012.01)
(54)发明名称概率预测模型训练方法、概率预测方法及装置(57)摘要本公开的实施例提供了一种概率预测模型训练方法、概率预测方法及装置。所述概率预测模型训练方法包括:获取与业务方关联的训练样本;所述训练样本包括与所述业务方关联的查询语句、所述业务方对应的业务方名称、所述业务方对应的业务方描述信息和所述查询语句与所述业务方关联的初始订单;将查询语句、所述业务方名称和所述业务方描述信息输入至初始概率预测模型,获取所述业务方对应的预测下单概率;根据所述初始订单和所述预测下单概率,计算得到所述初始排序模型的损失值;在所述损失值处于预设范围内的情况下,将所述初始概率预测模型作为目标概率预测模型。本公开实施例可以提高搜索到的业务方的排序效果,使得搜索结
果更加符合用户的需求。权利要求书4页  说明书14页  附图3页CN 111782676 A 2020.10.16
C N  111782676
A
1.一种概率预测模型训练方法,其特征在于,包括:
获取与业务方关联的训练样本;所述训练样本包括与所述业务方关联的查询语句、所述业务方对应的业务方名称、所述业务方对应的业务方描述信息和所述查询语句与所述业务方关联的初始订单;
将查询语句、所述业务方名称和所述业务方描述信息输入至初始概率预测模型,获取所述业务方对应的预测下单概率;
根据所述初始订单和所述预测下单概率,计算得到所述初始排序模型的损失值;
在所述损失值处于预设范围内的情况下,将所述初始概率预测模型作为目标概率预测模型。
2.根据权利要求1所述的方法,其特征在于,所述初始概率预测模型包括编码层和概率预测层,所述将查询语句、所述业务方名称和所述业务方描述信息输入至初始排序模型,获取所述业务方对应的预测下单概率,包括:
将所述查询语句、所述业务方名称和所述业务方描述信息进行拼接,得到所述业务方对应的拼接文本;
将所述拼接文本输入至所述初始概率预测模型;
调用所述编码层对所述拼接文本进行编码处理,生成所述拼接文本对应的编码向量;
调用所述概率预测层根据所述编码向量对所述训练样本进行概率预测,确定所述预测下单概率。
3.根据权利要求2所述的方法,其特征在于,所述将所述查询语句、所述业务方名称和所述业务方描述信息进行拼接,得到所述业务方对应的拼接文本,包括:在所述查询语句和所述业务方名称、所述业务方名称和所述业务方描述信息之间分别采用预置分隔符相连,得到所述拼接文本。
4.根据权利要求2所述的方法,其特征在于,所述调用所述编码层对所述拼接文本进行编码处理,生成所述拼接文本对应的编码向量,包括:
调用所述编码层对所述拼接文本进行编码处理,得到所述拼接拼接文本对应的字编码向量、片段编码向量和位置编码向量。
5.根据权利要求4所述的方法,其特征在于,所述调用所述概率预测层根据所述编码向量对所述训练样本进行概率预测,确定所述预测下单概率,包括:
调用所述概率预测层对所述字编码向量、所述片段编码向量和所述位置编码向量进行处理,生成所述预测下单概率。
6.根据权利要求1所述的方法,其特征在于,所述业务方描述信息包括:业务方品类信息、业务方标签信息和业务方位置信息中的至少一种。
7.一种概率预测方法,其特征在于,包括:
获取查询语句;
根据所述查询语句进行查询,得到与所述查询语句匹配的至少一个业务方;
获取所述至少一个业务方对应的业务方名称和业务方描述信息;
将所述查询语句、所述业务方名称和所述业务方描述信息输入至目标概率预测模型;
通过所述目标概率预测模型对所述查询语句、所述业务方名称和所述业务方描述信息进行处理,确定所述至少一个业务方对应的下单概率;
根据所述下单概率对所述至少一个业务方进行排序,并将排序后的业务方发送给所述查询语句对应的终端。
8.根据权利要求7所述的方法,其特征在于,所述将所述查询语句、所述业务方名称和所述业务方描述信息输入至目标概率预测模型,包括:
将所述查询语句、所述业务方名称和所述业务方描述信息进行拼接,得到所述业务方对应的拼接文本;
将所述拼接文本输入至所述目标概率预测模型。
9.根据权利要求7所述的方法,其特征在于,所述目标概率预测模型包括编码层和概率预测层,所述通过所述目标概率预测模型对所述查询语句、所述业务方名称和所述业务方描述信息进行处理,确定所述至少一个业务方对应的下单概率,包括:
调用所述编码层对所述查询语句、所述业务方名称和所述业务方描述信息进行编码处理,生成相应的编码向量;
调用所述概率预测层对所述编码向量进行处理,生成所述至少一个业务方对应的下单概率。
10.根据权利要求7所述的方法,其特征在于,所述根据所述下单概率对所述至少一个业务方进行排序,并将排序后的业务方发送给所述查询语句对应的终端,包括:根据所述下单概率由大至小的顺序,将所述至少一个业务方进行排序,得到排序后的业务方;
将所述排序后的业务方发送给所述终端。
11.一种概率预测模型训练装置,其特征在于,包括:
训练样本获取模块,用于获取与业务方关联的训练样本;所述训练样本包括与所述业务方关联的查询语句、所述业务方对应的业务方名称、所述业务方对应的业务方描述信息和所述查询语句与所述业务方关联的初始订单;
预测概率获取模块,用于将查询语句、所述业务方名称和所述业务方描述信息输入至初始概率预测模型,获取所述业务方对应的预测下单概率;
损失值计算模块,用于根据所述初始订单和所述预测下单概率,计算得到所述初始排序模型的损失值;
目标概率模型获取模块,用于在所述损失值处于预设范围内的情况下,将所述初始概率预测模型作为目标概率预测模型。
12.根据权利要求11所述的装置,其特征在于,所述初始概率预测模型包括编码层和概率预测层,所述预测概率获取模块包括:
第一拼接文本获取单元,用于将所述查询语句、所述业务方名称和所述业务方描述信息进行拼接,得到所述业务方对应的拼接文本;
第一拼接文本输入单元,用于将所述拼接文本输入至所述初始概率预测模型;
第一编码向量生成单元,用于调用所述编码层对所述拼接文本进行编码处理,生成所述拼接文本对应的编码向量;
第一下单概率确定单元,用于调用所述概率预测层根据所述编码向量对所述训练样本进行概率预测,确定所述预测下单概率。
13.根据权利要求12所述的装置,其特征在于,所述第一拼接文本获取单元包括:
拼接文本获取子单元,用于在所述查询语句和所述业务方名称、所述业务方名称和所述业务方描述信息之间分别采用预置分隔符相连,得到所述拼接文本。
14.根据权利要求12所述的装置,其特征在于,所述第一编码向量生成单元包括:
编码向量获取子单元,用于调用所述编码层对所述拼接文本进行编码处理,得到所述拼接拼接文本对应的字编码向量、片段编码向量和位置编码向量。
15.根据权利要求14所述的装置,其特征在于,所述第一下单概率确定单元包括:
预测下单概率生成子单元,用于调用所述概率预测层对所述字编码向量、所述片段编码向量和所述位置编码向量进行处理,生成所述预测下单概率。
16.根据权利要求11所述的装置,其特征在于,所述业务方描述信息包括:业务方品类信息、业务方标签信息和业务方位置信息中的至少一种。
17.一种概率预测装置,其特征在于,包括:
查询语句获取模块,用于获取查询语句;
业务方获取模块,用于根据所述查询语句进行查询,得到与所述查询语句匹配的至少一个业务方;
业务方信息获取模块,用于获取所述至少一个业务方对应的业务方名称和业务方描述信息;
业务方信息输入模块,用于将所述查询语句、所述业务方名称和所述业务方描述信息输入至目标概率预测模型;
下单概率确定模块,用于通过所述目标概率预测模型对所述查询语句、所述业务方名称和所述业务方描述信息进行处理,确定所述至少一个业务方对应的下单概率;
业务方发送模块,用于根据所述下单概率对所述至少一个业务方进行排序,并将排序后的业务方发送给所述查询语句对应的终端。
18.根据权利要求17所述的装置,其特征在于,所述业务方信息输入模块包括:
第二拼接文本获取单元,用于将所述查询语句、所述业务方名称和所述业务方描述信息进行拼接,得到所述业务方对应的拼接文本;
第二拼接文本输入单元,用于将所述拼接文本输入至所述目标概率预测模型。
19.根据权利要求17所述的装置,其特征在于,所述目标概率预测模型包括编码层和概率预测层,所述下单概率确定模块包括:
第二编码向量生成单元,用于调用所述编码层对所述查询语句、所述业务方名称和所述业务方描述信息进行编码处理,生成相应的编码向量;
下单概率生成单元,用于调用所述概率预测层对所述编码向量进行处理,生成所述至少一个业务方对应的下单概率。
20.根据权利要求17所述的装置,其特征在于,所述业务方发送模块包括:
业务方排序单元,用于根据所述下单概率由大至小的顺序,将所述至少一个业务方进行排序,得到排序后的业务方;
业务方发送单元,用于将所述排序后的业务方发送给所述终端。
21.一种电子设备,其特征在于,包括:
处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1至6任一项所述的概率预测模型训练方法,或权
利要求7至10任一项所述的概率预测方法。
22.一种可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如权利要求1至6任一项所述的概率预测模型训练方法,或权利要求7至10任一项所述的概率预测方法。

本文发布于:2024-09-21 15:23:45,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/435410.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:业务   概率   预测   模型   编码
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议