倒排索引的利用

1.配置

需要对schema中的查询字段设置indexed="true" termPositions="true" termVectors="true"

2.termVector使用

通过termVector = reader.getTermVector(int docID, String field)

获取文档id对应字段向量

通过字段向量，可以获取该字段中所有词和其词频，暂时还未找到方法获取其位置。

3.PostingsEnum使用

Term term(filed, value)

通过PostingsEnum reader.postings(Term term, int flags)

可以获取所有包含term的文档id，以及该term在文档的position位置。

灵感来源与Lucene倒排索引的存储方法。

倒排索引是从词找文档编号：

通过倒排索引的结果，可以知道通过词（term）可以获取包含该词的所有文档已经该词在该文档中的词频和位置。

每个DOC中包含有①文档ID②文档词频③词所在的位置