Requests库的爬虫实战

首先强调一下网络爬虫的“盗亦有道”，应该遵守Robots协议。

实例一：京东商品的页面的爬取

Requests库的爬虫实战

Requests库的爬虫实战

这里说明一下：最开始亚马逊不允许爬虫访问，然后改了一下user-agent,改为了常规的浏览器形式浏览，具体操作见图。

看到这里有没有发现，其实都是有固定的框架去编写一个爬虫代码。

Requests库的爬虫实战

360搜索引擎和百度的很相似，所不同的是，将其中的键由wd改为q

这个例子比前面的更难一点，需要好好理解一下。（嗯，我是这样认为的，因为我也是刚刚学）

Requests库的爬虫实战

http://m.ip138.com是一个IP地址查询的网站，在第五行URL+IP地址就能自动查询了