如何solr删除文件

问题描述:

我使用solr来索引70K左右的文件,我还没有发送任何删除策略,但即使如此,solr在完成70K文件的完整索引之前删除了很少的文件,所以想要了解这怎么可能,solr决定在整个索引完成之前删除文档的依据是什么。如何solr删除文件

在此先感谢

的删除是可能重复的ID,也就是说,你看到的是较早索引的文档的更新。更新是删除+添加,因此您最终将在索引中计入一个已删除的文档。

您自己在Solr中没有设置“删除策略”,但根据您提供Solr内容的方式,框架通常有一些方法可以检测已删除的条目并将它们从Solr中删除(DIH中是deletedPkQuery)。

+0

当您说更早的索引文档时,solr将如何识别,它将使用我们在schema.xml中指定的唯一字段还是与solr内部有关的东西将自动处理。 –

+0

如果添加了两个具有相同uniqueKey的文档,则后者将替换第一个(自动 - 没有什么要做)。 – MatsLindh

+0

所以这个uniqueKey正在谈论的是在模式文件中指定的那个?纠正我,如果我错了。 –