如何提高Marklogic中的xdmp：document-filter（）性能？

问题描述：

我使用xdmp:document-filter(doc())从文档（doc，docx，pdf等）提取元数据。我们正在使用它，因为它适用于各种文档格式，并为每种文档生成格式。但是这个命令的主要缺点是它减慢了查询速度。如果数据库中有一个或两个文档，则查询可以正常工作，但如果有更多文档（例如10或15），则查询速度会变慢。我们想要从数据库中所有文档的元数据中提取和显示信息。如何提高Marklogic中的xdmp：document-filter（）性能？

，我们正在使用这个查询： -

for $d in fn:doc() 
return xdmp:document-filter(doc(fn:base-uri($d)))

有没有什么办法让这个查询工作更快或有任何替代xdmp:document-filter()？

答

xdmp:document-filter()通常在ETL时间使用。如果您使用Information Studio加载内容，则可以添加“筛选文档”转换。您可以选择将提取的元数据作为单独的xhtml文档存储，还可以选择为文档属性。这样，他们不需要在每次请求时即时计算。

HTH！

如何提高Marklogic中的xdmp：document-filter（）性能？

相关推荐