2分钟带你学会网络爬虫:Excel批量爬取网页数据(详细图文版)

2分钟带你学会⽹络爬⾍:Excel批量爬取⽹页数据(详细图⽂版)
⾯对⽹页⼤量的数据,有时候还要翻页,你还在⼀页⼀页地复制粘贴吗?别⼈需要⼏⼩时完成
的任务,学会这个⼩技巧你只需要⼏分钟就能解决。快来学习使⽤Excel快速批量地爬取⽹页数
据吧!
1、分析⽹页数据结构
观察要爬取数据的⽹页结构,如要获取印尼农药登记数据,打开⽹页:
pestisida.id/simpes_app/rekap_formula_nama.php?
当代文学思潮s_keyword=&rekap_formula_nama1Page=1
可以看到,我们要获取总共74页的数据,⽽⽹页中的参数则代表了不同的参数,在⽹址中的最
后⼀个参数就是页码数,将“1”改成1-74的数字就是我们要爬取的⽹址。
2、爬取单个⽹页数据
1)打开Excel 2019,依次点击“数据”→“⾃⽹站”
2)在弹出的“从Web”对话框中选“⾼级”,在“URL部分”第⼀栏中输⼊不含有参数的⽹址,如:
pestisida.id/simpes_app/rekap_formula_nama.php?
s_keyword=&rekap_formula_nama1Page=,在第⼆栏中输⼊1表⽰抓取第⼀页的数据,最后点
击“确定”。
如果有多个参数,则每个参数设置为⼀栏。清贫思想
3)在弹出的“导航器”对话框中,选中左边需要的数据,右边可以预览到抓取的数据,最后点“编辑”,这样就可以抓取到⼀页⽹页的数据了。
3、爬取多个⽹页数据
1)在弹出的“Power Query编辑器”的编辑界⾯中,依次选择“开始”→“⾼级编辑器”,在编辑框军事行动代号
的“let”前⾯加⼊语句“(p as number) as table =>”,并将“源”后⾯的⽹页参数“1”换
教育评价成“(Number.ToText(p))”(不含引号),检查没有语法错误后点击“完成”,返回“Power Query编辑器”的编辑界⾯。
2)在返回的“Power Query编辑器”的编辑界⾯中,点击左边的“查询”栏上的箭头“>”,可以修改函数的名称,如“Indonesia Pesticide”。
说谎的男孩3)依次点击“开始”→“新建源”→“其他源”→“空查询”,在函数编辑栏中输⼊“” ,即要爬取的⽹页数,回车,⽣成序列,最后点中任意数列的值,选择“到表”,在弹出的“到表”对话框中点击确定即可。
分离度
4)选中左边栏的“查询1”,依次点击“添加列”→“调⽤⾃定义函数”,弹出“调⽤⾃定义函数”对话框中,在“功能查询”下拉菜单中选择刚才命名的函数“Indonesia Pesticide”,其它的会⾃动填写,点击“确定”就开始爬取⽹页数据了。
4、保存⽹页爬取数据

本文发布于:2024-09-20 15:33:54,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/538294.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

下一篇:常用希腊字符
标签:数据   点击   爬取   参数   函数   对话框
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议