一种基于知识图谱的语义搜索方法及装置[发明专利]

(19)中华人民共和国国家知识产权局
(12)发明专利
(10)授权公告号 (45)授权公告日 (21)申请号 201910943703.0(22)申请日 2019.09.30
(65)同一申请的已公布的文献号
申请公布号 CN  110704743 A (43)申请公布日 2020.01.17
(73)专利权人 北京科技大学地址 100083 北京市海淀区学院路30号(72)发明人 宁焕生 刘福超 
(74)专利代理机构 北京市广友专利事务所有限
责任公司 11237
代理人 张仲波(51)Int.Cl.
G06F  16/9535(2019.01)G06F  16/36(2019.01)G06F  40/30(2020.01)
(56)对比文件
CN  106599179 A ,2017.04.26CN  108563710 A ,2018.09.21CN  109710621 A ,2019.05.03CN  106095762 A ,2016.11.09CN  108270785 A ,2018.07.10CN  109522465 A ,2019.03.26CN  110069638 A ,2019.07.30CN  106503035 A ,2017.03.15
审查员 刘冰
(54)发明名称
一种基于知识图谱的语义搜索方法及装置(57)摘要
本发明提供一种基于知识图谱的语义搜索方法及装置,能够为用户提供准确地个性化搜索,且能够提高搜索效率和搜索准确度。所述方法包括:提取用户输入的待查询请求中的关键词,将提取的每一个关键词在本体库中进行概念的匹配,其中,所述待查询请求用于查询养老机构资源;若匹配成功,则执行基于本体的语义扩展;若执行失败,则执行基于知识图谱的语义扩展;根据用户的历史行为,确定基于用户行为的语义相似度;根据确定的基于用户行为的语义相似度及语义扩展结果,预测用户对养老机构资源的评分,将评分高的若干个养老机构资源信息作为推荐列表返回给用户。本发明涉及搜索引擎、
计算机信息处理领域。
权利要求书2页  说明书7页  附图1页
CN 110704743 B 2022.02.18
C N  110704743
B
1.一种基于知识图谱的语义搜索方法,其特征在于,包括:提取用户输入的待查询请求中的关键词,将提取的每一个关键词在本体库中进行概念的匹配,其中,所述待查询请求用于查询养老机构资源;
若匹配成功,则执行基于本体的语义扩展;若执行失败,则执行基于知识图谱的语义扩展;
根据用户的历史行为,确定基于用户行为的语义相似度;根据确定的基于用户行为的语义相似度及语义扩展结果,预测用户对养老机构资源的评分,将评分高的若干个养老机构资源信息作为推荐列表返回给用户;
其中,所述若匹配成功,则执行基于本体的语义扩展包括:若匹配成功,则得到所述关键词映射到本体库中的实体概念,其中,映射得到的实体概念为待扩展实体概念;
计算每一个待扩展实体概念与本体库中的其他实体概念的语义相似度;
将语义相似度值大于预设的第一阈值时的其他本体概念作为相应待扩展实体概念的扩展词;
其中,语义相似度表示为:
其中,Sim ONT (c 1,c 2)表示基于本体的语义相似度,f 1和f 2分别表示实体概念c 1和c 2与最近的公共父节点之间的最短路径,D是c 1和c 2所在本体层次结构中的最大深度;
其中,所述若执行失败,则执行基于知识图谱的语义扩展包括:若执行失败,则根据已构建的养老机构知识图谱,对待扩展实体概念与养老机构知识图谱中的本体概念分别进行继承关联和路径关联计算;
将关联值之和大于预设的第二阈值时的养老机构知识图谱中的本体概念作为待扩展实体概念的扩展词;
其中,继承关联计算表达式为:
其中,Inherit(c i ,c j )表示实体概念c i 和c j 的继承关联值,k表示实体概念c i 和c j 的局部深度最大的共同祖先数量,a n 是c i 和c j 的局部深度最大的共同祖先,是a n 在本体层次结
构中的深度,
是a n 所在分支的最大深度;
其中,路径关联计算表达式为:
其中,Path(c i ,c j )表示实体概念c i 和c j 的路径关联值,m表示实体概念c i 和c j 的路径关联条数,length n 为c i 和c j 之间第n条路径关联长度;
关联值之和表示为:
Sim KG (c i ,c j )=Inherit(c i ,c j )+Path(c i ,c j )其中,Sim KG (c i ,c j )表示继承关联值和路径关联值的和。
2.根据权利要求1所述的基于知识图谱的语义搜索方法,其特征在于,若历史行为为用户评分,则基于用户行为的语义相似度表示为:
其中,W ij 表示基于用户行为的养老机构资源i和j之间的相似度,|N(i)|表示对养老机构资源i进行评分的用户数,|N(j)|表示对养老机构资源j进行评分的用户数,|N(i)∩N(j)|是同时对养老机构资源i和j进行评分的用户数,养老机构资源i为实体概念c i ,养老机构资源j为实体概念c j 。
3.根据权利要求2所述的基于知识图谱的语义搜索方法,其特征在于,用户对养老机构资源的评分表示为:
其中,P ui 表示用户u对养老机构资源i的评分;N(u)表示用户u所评分过的养老机构资源的集合,S(i ,k)表示与养老机构资源i最相似的k个资源集合;N(u)∩S(i ,k)表示生成的参考资源集合,作为对资源i进行评分的参考;Sim(c i ,c j )表示养老机构资源i与养老机构资源j的融合相似度,r ui 表示用户u对养老机构资源i的兴趣度。
4.根据权利要求3所述的基于知识图谱的语义搜索方法,其特征在于,若是执行基于本体的语义扩展,则融合相似度表示为:
Sim(c i ,c j )=α·Sim ONT (c i ,c j )+(1‑α)W ij 其中,Sim(c i ,c j )表示基于本体和用户行为的融合相似度;α为融合因子,表示Sim(c i ,c j )中Sim ONT (c i ,c j )所占的比例;
若是执行基于知识图谱的语义扩展,则融合相似度表示为:Sim(c i ,c j )=α·Sim KG (c i ,c j )+(1‑α)W ij 其中,Sim(c i ,c j )表示基于知识图谱和用户行为的融合相似度;α为融合因子,表示Sim (c i ,c j )中Sim KG (c i ,c j )所占的比例。
一种基于知识图谱的语义搜索方法及装置
技术领域
[0001]本发明涉及搜索引擎、计算机信息处理领域,特别是指一种基于知识图谱的语义搜索方法及装
置。
背景技术
[0002]近年来,随着信息科技的迅猛发展,网络信息资源呈现爆炸式地增长,人们在享受互联网信息交互带来巨大便利的同时,也受到“信息迷航”、“认知过载”等问题的困扰。[0003]面对互联网上养老资源信息的日益增多,现有的搜索方式未考虑语义信息和用户特征,不能理解用户查询意图,导致用户搜索效率和搜索精确度低,且不能为用户提供精准地个性化的搜索服务。
发明内容
[0004]本发明要解决的技术问题是提供一种基于知识图谱的语义搜索方法及装置,以解决现有技术所存在的用户搜索效率和搜索精确度低,且不能为用户提供精准地个性化的搜索服务的问题。
[0005]为解决上述技术问题,本发明实施例提供一种基于知识图谱的语义搜索方法,包括:
[0006]提取用户输入的待查询请求中的关键词,将提取的每一个关键词在本体库中进行概念的匹配,其中,所述待查询请求用于查询养老机构资源;[0007]若匹配成功,则执行基于本体的语义扩展;若执行失败,则执行基于知识图谱的语义扩展;
[0008]根据用户的历史行为,确定基于用户行为的语义相似度;[0009]根据确定的基于用户行为的语义相似度及语义扩展结果,预测用户对养老机构资源的评分,将评分高的若干个养老机构资源信息作为推荐列表返回给用户。[0010]进一步地,所述若匹配成功,则执行基于本体的语义扩展包括:[0011]若匹配成功,则得到所述关键词映射到本体库中的实体概念,其中,映射得到的实体概念为待扩展实体概念;
[0012]计算每一个待扩展实体概念与本体库中的其他实体概念的语义相似度;
[0013]将语义相似度值大于预设的第一阈值时的其他本体概念作为相应待扩展实体概念的扩展词。
[0014]进一步地,语义相似度表示为:
[0015][0016]
其中,Sim ONT (c 1,c 2)表示基于本体的语义相似度,f 1和f 2分别表示实体概念c 1和c 2与最近的公共父节点之间的最短路径,D是c 1和c 2所在本体层次结构中的最大深度。[0017]进一步地,所述若执行失败,则执行基于知识图谱的语义扩展包括:
[0018]
若执行失败,则根据已构建的养老机构知识图谱,对待扩展实体概念与养老机构
知识图谱中的本体概念分别进行继承关联和路径关联计算;
[0019]将关联值之和大于预设的第二阈值时的养老机构知识图谱中的本体概念作为待扩展实体概念的扩展词。[0020]进一步地,继承关联计算表达式为:
[0021]
[0022]
其中,Inherit(c i ,c j )表示实体概念c i 和c j 的继承关联值,k表示实体概念c i 和c j 的
局部深度最大的共同祖先数量,a n 是c i 和c j 的局部深度最大的共同祖先,是a n 在本体层
次结构中的深度,
是a n 所在分支的最大深度。
[0023]进一步地,路径关联计算表达式为:
[0024][0025]
其中,Path(c i ,c j )表示实体概念c i 和c j 的路径关联值,m表示实体概念c i 和c j 的路径关联条数,length n 为c i 和c j 之间第n条路径关联长度;[0026]关联值之和表示为:
[0027]Sim KG (c i ,c j )=Inherit(c i ,c j )+Path(c i ,c j )[0028]其中,Sim KG (c i ,c j )表示继承关联值和路径关联值的和。[0029]进一步地,若历史行为为用户评分,则基于用户行为的语义相似度表示为:
[0030]
[0031]
其中,W ij 表示基于用户行为的养老机构资源i和j之间的相似度,|N(i)|表示对养老机构资源i进行评分的用户数,|N(j)|表示对养老机构资源j进行评分的用户数,|N(i)∩N(j)|是同时对养老机构资源i和j进行评分的用户数,养老机构资源i为实体概念c i ,养老机构资源j为实体概念c j 。[0032]进一步地,用户对养老机构资源的评分表示为:
[0033]
[0034]
其中,P ui 表示用户u对养老机构资源i的评分;N(u)表示用户u所评分过的养老机构资源的集合,S(i ,k)表示与养老机构资源i最相似的k个资源集合; N(u)∩S(i ,k)表示生成的参考资源集合,作为对资源i进行评分的参考; Sim(c i ,c j )表示养老机构资源i与养老机构资源j的融合相似度,r ui 表示用户u对养老机构资源i的兴趣度。[0035]进一步地,若是执行基于本体的语义扩展,则融合相似度表示为:[0036]Sim(c i ,c j
)=α·Sim ONT (c i ,c j )+(1‑α)W ij
[0037]其中,Sim(c i ,c j )表示基于本体和用户行为的融合相似度;α为融合因子,表示Sim (c i ,c j )中Sim ONT (c i ,c j )所占的比例;
[0038]若是执行基于知识图谱的语义扩展,则融合相似度表示为:

本文发布于:2024-09-24 14:22:08,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/399132.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:用户   资源   语义
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议