【重磅推荐】python爬虫框架Scrapy的项目初始化和爬虫模块初始化的注意事项(务必跟着这个套路来,否则乱七八糟的问题都会出来!)
慎重提醒:命令创建好环境之后,不要轻易去修改系统创建好的文件名,否则会引发很多错误!
创建一个成功的Scrapy3爬虫项目结构的步骤:
第一步:创建好pipenv虚拟环境目录!
第二步:在当前目录下,使用命令:scrapy startproject project_name【项目名】
第三步:进入spiders目录执行命令:scrapy genspider<name> <domain> 【domain是制定需要爬虫的域名,不要带http】
第四步:运行文件执行命令 scrapy crawl book (spider_name爬虫文件名)【务必在当前项目的根目录如图第一个tutorial2019下执行,否则会提示无法找到 crawl命令】
第五步:在scrapy.cfg文件的同目录下创建一个mian.py调试文件:调试文件的代码参考:https://blog.****.net/weixin_43343144/article/details/87886148