关于 es的全文搜索
常用的全文检索:
- 顺序扫描法
- 全文搜索(建立文本库=> 建立索引)
基于 java 的常用搜索引擎:
- Lucene
- ElasticSearch
- Solr
es 和 solr选哪个用 还是看业务场景
使用的特点:
-
高度可扩展的开源全文搜索引擎和分析引擎
-
快速地,近实时地对大数据进行存储、搜索和分析
-
用来支撑有复杂的数据搜索需求的企业级应用
-
分布式
-
高可用
-
多API
-
面向文档(不需要定义一些模式)
-
异步写入(性能高)
-
近实时
-
基于Lucene
-
尊享Apache协议
es 每隔 N秒刷新一次索引,定期同步到磁盘中去,因此不是创建索引立即生效
集群,多个节点的集合
索引: 加快搜索速度
类型: 对索引的进一步细分(根据产品的特征划分类型)
文档: 索引的基本单位,使用 json格式 存储
分片:运行把索引分成多个分片,每个分片存储部分数据(因为可能存储的数据数量比较大),并且有副本,自动管理这些副本,提高性能和吞吐量
副本: 高可用,提高他的搜索量和吞吐量