ElasticSearch分词器使用及索引操作

一、分词器

ES内置默认分词器

ElasticSearch分词器使用及索引操作

ElasticSearch 核心功能就是数据检索,首先通过索引将文档写入 es。查询分析则主要分为两个步骤:

  • 词条化:分词器将输入的文本转为一个一个的词条流。
  • 过滤:比如停用词过滤器会从词条中去除不相干的词条(的,嗯,啊,呢);另外还有同义词过滤器、小写过滤器等。

ES中文分词器

安装

  • 首先打开分词器官网:https://github.com/medcl/elasticsearch-analysis-ik。
  • 在 https://github.com/medcl/elasticsearch-analysis-ik/releases 页面找到最新的正式版,下载下来。我们这里的下载链接是 https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.9.3/elasticsearch-analysis-ik-7.9.3.zip。
  • -将下载文件解压。
  • 在 es/plugins 目录下,新建 ik 目录,并将解压后的所有文件拷贝到 ik 目录下。重启 es 服务。

使用

ElasticSearch分词器使用及索引操作

自定义远程扩展词库

  • 新建项目,在资源目录下创建测试文件ext.dic
    ElasticSearch分词器使用及索引操作

  • 修改es配置文件(elasticsearch-7.9.3\plugins\ik\config\IKAnalyzer.cfg.xml)
    ElasticSearch分词器使用及索引操作

  • 重启es服务

  • 测试
    ElasticSearch分词器使用及索引操作

ES索引操作命令(Postman测试)

创建索引

Put /{索引名字}
ElasticSearch分词器使用及索引操作

注意:索引名字不能有大写字母;索引名字不能重复

查看索引

查看指定索引名

Get /{索引名字}/_settings
ElasticSearch分词器使用及索引操作

查看所有索引

Get/_all/_settings
ElasticSearch分词器使用及索引操作

删除索引

Delete /{索引名字}
ElasticSearch分词器使用及索引操作

修改索引

Put /{索引名字}/_settings
ElasticSearch分词器使用及索引操作