分分钟教你爬取央视新闻app

"""
用fiddler爬取央视新闻app, 2020年8月19日的一整天新闻数据
- app中时间链可以选择日期
- 注意我要当天全部新闻信息,可以向下刷新
- 提取以下字段保存为csv数据
    'itemTitle': 标题
    'operate_time': 发布时间
    'detailUrl': 新闻链接
    'itemImage': 图片链接
   
- 请在下方实现代码
"""
import requests
import csv
'''
GET v/api/rest/articleInfo/getScrollList?n=20version=1p=1pubDate=1597806209000app_version=807
User-Agent: SM-G9730
Host: v
Connection: Keep-Alive
Accept-Encoding: gzip
GET v/api/rest/articleInfo/getScrollList?
User-Agent: SM-G9730
Host: v
Connection: Keep-Alive
Accept-Encoding: gzip
n=20
version=1
p=2
pubDate=159********00
app_version=807
'''
number = 0
number2 = 0
try:
    while True:
        number += 1
        url = 'v/api/rest/articleInfo/getScrollList?'
        params = {
            'n': '20',
            'version': '1',
            'p': number,
            'pubDate': '1597806209000',
            'app_version': '807',
        }
        headers = {
            'User-Agent': 'SM-G9730',
            'Host': 'v',
            'Connection': 'Keep-Alive',
            'Accept-Encoding': 'gzip',
        }
        response = (url=url,headers=headers,params=params)
        html = response.json()
        for i in range(0,20):
            result1 = html['itemList'][i]['itemTitle']
            result2 = html['itemList'][i]['operate_time']
            result3 = html['itemList'][i]['detailUrl']
            result4 = html['itemList'][i]['itemImage']['imgUrl1']
            print(result1)
            print([result2])
            print(result3)
            print(result4)
            number2 += 1
            print()
            with open('央视新闻.csv', mode='a', encoding='utf-8', newline='')as f:
                csv_writer = csv.writer(f)
                csv_writer.writerow([result1,result2,result3,result4])
except:
    print(number2)

本文发布于:2024-09-20 06:42:48,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/823424.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:新闻   信息   时间   全部   向下   保存   实现   代码
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议