从零实现基于Scrapy-redis和ElasticSearch的搜索引擎（附代码及构建过程）

项目整体分为scrapy-redis分布式爬虫爬取数据、基于ElasticSearch数据检索和前端界面展示三大模块。做此项目是为了熟悉scrapy-redis的基本流程，以及其背后的原理，同时熟悉ElasticSearch的使用。本项目可以作为一个基于ES存储的简单但是相对全面的全栈开发的Demo。项目中所采用的组件均在win10本地环境搭建（伪分布），旨在演示项目流程。你可以参考该项目，并将其扩展到多个主机上，实现分布式ES以及分布式Scrapy。
项目涉及很多内容，鉴于篇幅有限，不便展开。本文尽可能清晰的说明项目框架、运行流程以及可能出现的问题。但是，相信你一定会遇到其他困难，你需要查阅文档(文末列出部分参考文档)。解决困难的过程
正是你进步的过程。
共爬取12539组数据，本地以json格式存储一份（如有需要可以联系），ElasticSearch自动存储一份

scrapy-redis端(example)
- 运行add_seed.py添加种子
  - 确保redis服务已经启动
  - 也可以通过在redis-cli.exe 客户端执行如下命令添加种子
    - lpush jobnews:start_urls http:http://www.job5156.com
- 运行 debug.py执行爬虫操作
- 等待爬取结果
  - 可以通过redis-desktop-manager查看redis数据库中处理结果
- 使用kibana的console适应GET命令查看ElasticSearch数据存储情况
  - 你需要确保kibana服务已经启动，然后访问本地5601端口进入kinaba console
  - 如 GET /jobnews/_count 查看数据总量
web-elasticsearch端(WebProject)
- 在 Pycharm terminal 执行命令
  python manage.py runserver
- 浏览器打开本地8000端口