一种基于字典的位片索引压缩方法[发明专利]

专利名称:一种基于字典位片索引压缩方法专利类型:发明专利
发明人:刘晓光,刘欣瑀,王刚,张瞾华
申请号:CN201810716805.4
申请日:20180703
公开号:CN108932738A
公开日:
20181204
专利内容由知识产权出版社提供
摘要:一种基于字典的位片索引压缩方法和优化策略,适用于以BitFunnel为代表的0/1位片索引结构。本发明的方法包括:1、文档重排:以块大小为间隔根据索引列中比特1的密度重排文档以期增加块间重复度。2、部分压缩:选取部分查询低频访问行进行压缩。3、字典压缩:将索引划分成块,将一个全1比特块和索引中高频出现块存入字典。对出现在字典中的块用更少比特位的块编号替代;对未出现在字典中的块用字典中的最近似块的编号替代(会导致查询请求存在误称结果但保证不丢解)。本发明适用于信息检索领域位片索引压缩的场景中。本发明可显著提高索引压缩效果,且不会造成较大的解压延迟,对搜索引擎系统的优化有很重要的意义。
申请人:南开大学
地址:300071 天津市南开区卫津路94号
国籍:CN
代理机构:天津耀达律师事务所
代理人:侯力

本文发布于:2024-09-20 17:27:53,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/432116.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:压缩   字典   位片   查询   方法   专利   天津市   文档
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议