数据爬取方法、装置、计算机设备及存储介质[发明专利]

专利名称:数据爬取方法、装置、计算机设备及存储介质专利类型:发明专利
发明人:蔡俊
申请号:CN201810594254.9
申请日:20180611
公开号:CN108897788A
公开日:
20181127
专利内容由知识产权出版社提供
摘要:本发明公开了一种数据爬取方法、装置、计算机设备及存储介质,所述方法包括,通过采用网络标识信息访问第一网页,若访问成功,且第一网址为非域名,则对第一网址进行解析,得到第一网址对应的域名,访问域名对应的第一网站的首页,若访问成功,且所述第一网址为域名或访问域名对应的第一网站的首页成功,则遍历各个第二网页,若访问成功,对第二网页内容进行解析,得到需要爬取的数据,若访问第一网址对应的第一网页不成功,或者访问域名对应的第一网站的首页不成功,或者遍历各个第二网页不成功,则采用Tornado分派新的网络标识信息至标识频道,返回执行采用网络标识信息访问对应的第一网页的步骤,从而提高了数据爬取的稳定性。
申请人:平安科技(深圳)有限公司
地址:518000 广东省深圳市福田区八卦岭工业区平安大厦六楼
国籍:CN
代理机构:深圳众鼎专利商标代理事务所(普通合伙)
代理人:胡志桐

本文发布于:2024-09-20 15:31:09,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/764502.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:访问   专利   标识   爬取   对应   数据   信息
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议