网络爬虫之框架 5-1 Scrapy爬虫框架
文章截图均来自中国大学mooc Python网络爬虫与信息提取的教程,以上仅作为我的个人学习笔记。下面是教程链接:
Scrapy爬虫框架介绍:
使用:pip install srcapy 进行安装
安装后小测:执行 scrapy -h
Scrapy不是一个简单的函数功能库,而是一个爬虫框架
爬虫框架:
- 是实现爬虫功能的一个软件结构和功能组件的集合
- 爬虫框架是一个半成品,可以帮助用户实现专业网络爬虫
Scrapy爬虫框架的内容:5+2结构
Scrapy爬虫框架的解析:
Requests和Scrapy的比较:
选择角度:
Scrapy爬虫的常用命令:
为什么Scrapy爬虫框架为什么采用命令行创建和运行爬虫:
单元小结:
5+2结构
三个数据流的路径
和Requests库的不同与择优
命令行