一种基于编码可导航伸展图的近邻文档搜索方法[发明专利]

专利名称:一种基于编码可导航伸展图的近邻文档搜索方法专利类型:发明专利
发明人:徐小良,王梦召
申请号:CN201910949234.3
申请日:20191008
公开号:CN110851563A
公开日:
20200228
专利内容由知识产权出版社提供
摘要:本发明公开了一种基于编码可导航伸展图的近邻文档搜索方法。该方法首先对海量文档语义向量化得到海量文档向量;然后计算所有文档向量每一维的大小范围得到区间范围向量并归一化编码后进行压缩存储;接着基于压缩存储的海量文档向量建立编码可导航伸展图;最后对查询文档语义向量化后,在编码可导航伸展图上进行贪婪搜索后返回最接近的TopK篇文档。本发明将优秀的图基近似最近邻搜索方法——可导航伸展图应用在海量文档搜索上,加快了文档搜索速度,使用归一化编码的方法对海量文档向量进行压缩存储,在保证相当搜索速度的同时又大幅度降低了内存消耗。
申请人:杭州电子科技大学
地址:310018 浙江省杭州市经济技术开发区白杨街道2号大街
国籍:CN
代理机构:浙江千克知识产权代理有限公司
代理人:周希良

本文发布于:2024-09-21 02:31:22,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/764517.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:文档   搜索   海量   编码
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议