python爬虫入门

什么是爬虫

网络爬虫,是一种按照一定规则,自动抓取互联网信息的程序或者脚本。由于互联网数据的多样性和资源的有限性,根据用户需求定向抓取相关网页并分析已经成为如今主流的爬取策略

爬虫可以做什么

你可以爬取自己自己想看的图片,爬取自己想看的视频等等,只要你能通过浏览器访问的数据,都可以通过爬虫获取。

爬虫的本质是什么

模拟浏览器打开网页,获取网页中我们想要的那部分数据

网络爬虫(网络蜘蛛)原理图

python爬虫入门
搜索引擎原理图
python爬虫入门

爬虫的基本流程

python爬虫入门