爬虫实例

scrapy是python最有名的爬虫框架之一，可以很方便的进行web抓取，并且提供了很强的定制型，这里记录简单学习的过程和在实际应用中会遇到的一些常见问题

一、安装

在安装scrapy之前有一些依赖需要安装，否则可能会安装失败，scrapy的选择器依赖于lxml，还有Twisted网络引擎，还需要配置python的环境变量以及python的script的变量
以下是windows安装:

Scrapy的安装：
1.scrapy需要安装第三方库文件，lxml和Twisted开头的文件
2.下载地址：https://www.lfd.uci.edu/~gohlke/pythonlibs/
3.下载好文件之后，在DOS命令下pip install 文件的位置（lxlm）Twisted
4.安装完成就可以安装：pip install scrapy
5. 还需要安装 win32（启动蜘蛛的时候会提示安装，根据python版本来的我32位）pip install pypiwin32

二、基本使用