一种搜索引擎抓取网页媒体内容信息的方法和装置[发明专利]

专利名称:一种搜索引擎抓取网页媒体内容信息的方法和装置专利类型:发明专利
发明人:侯小虎
申请号:CN201310487302.1
申请日:20131017
公开号:CN103761230A
公开日:
20140430
专利内容由知识产权出版社提供
摘要:本发明公开了一种搜索引擎抓取网页媒体内容信息的方法,包括步骤:抓取网页信息;检测网页信息是否包含预设的媒体内容的信息的标识;在检测到网页信息中包含标识的情况下,提取网页信息中的文字信息和媒体内容信息;以及基于文字信息和媒体内容信息,分别建立文字索引库和媒体内容索引库。
申请人:北京奇虎科技有限公司,奇智软件(北京)有限公司
地址:100088 北京市西城区新街口外大街28号D座112室(德胜园区)
国籍:CN
代理机构:北京市中伦律师事务所
代理人:张思悦

本文发布于:2024-09-22 09:45:14,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/464692.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:信息   内容   网页   北京市   媒体   有限公司   抓取   中伦
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议