【中文分词】使用IKAnalyzer分词统计词频

一.引入jar包:

【中文分词】使用IKAnalyzer分词统计词频【中文分词】使用IKAnalyzer分词统计词频

二.在src目录下配置IKAnalyzer.cfg.xml

【中文分词】使用IKAnalyzer分词统计词频

有需要可以自己扩展词汇与停止词

三.根据分词统计词频:

1.传入参数进行分词,并统计每个词的频率。代码如下:

【中文分词】使用IKAnalyzer分词统计词频

2.按词频高低排序,代码如下:【中文分词】使用IKAnalyzer分词统计词频

3.整理简单工具类,代码如下:【中文分词】使用IKAnalyzer分词统计词频

其中IKSegmenter是分词的主要类,构造函数ture代表只能分词,改成false则为最细粒度分词