ElasticSearch分词器使用及索引操作
一、分词器
ES内置默认分词器
ElasticSearch 核心功能就是数据检索,首先通过索引将文档写入 es。查询分析则主要分为两个步骤:
- 词条化:分词器将输入的文本转为一个一个的词条流。
- 过滤:比如停用词过滤器会从词条中去除不相干的词条(的,嗯,啊,呢);另外还有同义词过滤器、小写过滤器等。
ES中文分词器
安装
- 首先打开分词器官网:https://github.com/medcl/elasticsearch-analysis-ik。
- 在 https://github.com/medcl/elasticsearch-analysis-ik/releases 页面找到最新的正式版,下载下来。我们这里的下载链接是 https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.9.3/elasticsearch-analysis-ik-7.9.3.zip。
- -将下载文件解压。
- 在 es/plugins 目录下,新建 ik 目录,并将解压后的所有文件拷贝到 ik 目录下。重启 es 服务。
使用
自定义远程扩展词库
-
新建项目,在资源目录下创建测试文件ext.dic
-
修改es配置文件(elasticsearch-7.9.3\plugins\ik\config\IKAnalyzer.cfg.xml)
-
重启es服务
-
测试
ES索引操作命令(Postman测试)
创建索引
Put /{索引名字}
注意:索引名字不能有大写字母;索引名字不能重复
查看索引
查看指定索引名
Get /{索引名字}/_settings
查看所有索引
Get/_all/_settings
删除索引
Delete /{索引名字}
修改索引
Put /{索引名字}/_settings