爬取搜狐财经

任务描述

爬取搜狐财经的实时新闻信息。
搜狐财经网址:https://m.sohu.com/ch/15
需要的字段: 标题、链接、发布时间、新闻正文

爬取分析

根据经验,F12 选择手机模式,
爬取搜狐财经
向下滚动,观察 XHR 栏:
爬取搜狐财经
很快找到了我们需要的接口。

然后观察接口规律:
爬取搜狐财经

发现随着翻动 ,发送 ajax 请求,随之变化的量有 2 个:一个是请求的时间戳,一个是请求的页数。

一般我比较习惯使用一个变化的量去构造请求,来测试一波:

(1)