基于语义的信息采集方法及系统[发明专利]

专利名称:基于语义的信息采集方法及系统专利类型:发明专利
发明人:李涓子,祁羽,何巍,焦程波,张鹏,杨瑞兵申请号:CN201310452655.8
申请日:20130927
公开号:CN103473369A
公开日:
20131225
专利内容由知识产权出版社提供
摘要:本发明涉及数据挖掘技术领域,具体涉及一种基于语义的信息采集方法及系统。该信息采集方法包括步骤:S1.根据网络资源的典型特征,建立网络资源抽象数据模型;S2.借助搜索引擎从互联网采集网络信息,并将采集的网络信息用所述网络资源抽象数据模型进行格式化处理;S3.对格式化处理后的网络信息进行聚类分析,并根据聚类分析结果将所述网络信息划分入对应的话题中,并提取每个话题的标签;S4.对所述步骤S3中处理结果进行可视化展示。本发明由话题驱动进行网络资源组织、可视化展示以及对网络资源的下载和离线查看,从而可以多维度的对网络信息进行展现,以形象、直观的方式将网络信息呈现给用户,实现了提高用户浏览效率的效果。
申请人:清华大学
地址:100084 北京市海淀区清华园北京100084-82信箱
国籍:CN
代理机构:北京路浩知识产权代理有限公司
代理人:李相雨

本文发布于:2024-09-23 05:31:32,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/429536.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:信息   网络   网络资源   采集   进行
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议