Elasticsearch分词器

什么是分词器?
分词器:elasticsearch执行分词的主体，分为三大部分:Character Filters，Tokenizers，Token Filters

Character Filter（字符过滤器）

注意：Character Filter可以有n个(n=0)
字符过滤器通过字符流(以最小单位读取)的形式接收文本，通过新增，删除，修改字符来转换该流
比如：去掉文本中的html标签，

Tokenizers（分词器）

注意：Tokenizers只能有1个
按照规则去切分单词
比如:I am charger ---->I,am,charger

Token filters （token过滤器）

注意：Token filters可以有n个(n=0)
将切分的单词进行处理，比如删除，大小写转换

elasticsearch中的分词器有哪些？

采用postman演示各个分词器效果：

1.Standard Analyer(默认分词器，按词切分，小写处理) Elasticsearch分词器
2.Simple Analyer（按照非字母切分(符号会被过滤)，小写处理）

3.Stop Analyer（小写处理，停用词过滤）

自行到es安装根目录输入命令:./bin/elasticsearch-plugin install analysis-icu