基于相关性分数分布对查询意图进行分类的方法[发明专利]

专利名称:基于相关性分数分布查询意图进行分类的方法专利类型:发明专利
发明人:闫宏飞,刘晓兵,徐谷子,何靖,李铄
申请号:CN201110415617.6
申请日:20111213
公开号:CN102411626A
公开日:
20120411
专利内容由知识产权出版社提供
摘要:本发明涉及网络和信息检索技术领域,公开了一种基于相关性分数分布对查询意图进行分类的方法,包括以下步骤:S1、获取查询的检索结果和网页;S2、根据所述检索结果和网页构建检索结果集;S3、度量所述检索结果集中文档的相关性分数;S4、利用相关性分数的分布对查询意图进行分类。本发明采用改进的Hits算法、改进的PageRank算法以及改进的检索模型三种方式获取检索结果的相关性分数,解决了现有的方案中长尾分布的查询点击日志不足的问题,也解决了基于锚文本的方法中,无法在锚文本中到匹配的锚文本集合或者集合中元素过少的问题。
申请人:北京大学
地址:100871 北京市海淀区颐和园路5号
国籍:CN
代理机构:北京路浩知识产权代理有限公司
代理人:王莹

本文发布于:2024-09-24 02:22:17,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/439205.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:检索   查询   结果   分布   分数   分类   进行   意图
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议