一种网站分类字典的构建方法及装置[发明专利]

专利名称:一种网站分类字典的构建方法及装置专利类型:发明专利
发明人:张惊申,梁力文
申请号:CN201610993453.8
申请日:20161110
公开号:CN106649563B
公开日:
20220225
专利内容由知识产权出版社提供
摘要:本发明实施例公开了一种网站分类字典的构建方法及装置,该方法包括:获取预设的N个初始网站类别中的每个初始网站类别对应的至少一个样本网站的网页内容,其中,N为正整数;根据所获取的网页内容,确定每个初始网站类别对应的有效词语,并为每个有效词语配置初始权重值;统计每个有效词语对应的初始网站类别的个数;将统计得到的个数大于1的有效词语的初始权重值调小,确定每个有效词语的最终权重值;对于每个初始网站类别,将对应的每个有效词语和最终权重值对应存储至该初始网站类别的网站分类字典中,进而根据该网站分类字典对网站进行分类。应用本发明实施例,使得权重值设置更加合理,提高了网站分类的准确度。
申请人:新华三技术有限公司
地址:310052 浙江省杭州市滨江区长河路466号
国籍:CN
代理机构:北京柏杉松知识产权代理事务所(普通合伙)

本文发布于:2024-09-20 12:16:40,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/752115.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:网站   初始   分类   类别   权重
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议