一种对海量URL进行存储和查询方法[发明专利]

专利名称:一种对海量URL进行存储和查询方法专利类型:发明专利
发明人:李建明
申请号:CN201110338204.2
申请日:20111031
公开号:CN102411617A
公开日:
20120411
专利内容由知识产权出版社提供
摘要:本发明公开了一种对海量URL进行存储和查询的方法,首先利用数据表存储URL的MD5值和特征字符串,其中特征字符串是先将URL原始字符串开头到“//WWW.”部分去除,再将剩余字符串按照“/”分割为多个字符串,取前N个分割后字符串的第一个和最后一个字符顺序拼接组成(N为8~12的整数);分别对数据表中的特征字符串和MD5值建立树形索引。精确查询时,计算待查询URL 的MD5值,查询数据表中的MD5字段即可;后模糊匹配查询时,根据待查询URL的特征字符串,先查询对数据表中的特征字符串字段,取特征字符串相符的URL值,再将待查询URL与这些URL值进行实际匹配查询。
申请人:北京锐安科技有限公司
地址:100044 北京市海淀区中关村南大街乙56号方圆大厦9层
国籍:CN
代理机构:北京君尚知识产权代理事务所(普通合伙)
代理人:李稚婷

本文发布于:2024-09-23 09:20:59,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/779538.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:字符串   查询   特征   知识产权
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议