如何提高Marklogic中的xdmp:document-filter()性能?
问题描述:
我使用xdmp:document-filter(doc())
从文档(doc,docx,pdf等)提取元数据。我们正在使用它,因为它适用于各种文档格式,并为每种文档生成格式。但是这个命令的主要缺点是它减慢了查询速度。如果数据库中有一个或两个文档,则查询可以正常工作,但如果有更多文档(例如10或15),则查询速度会变慢。我们想要从数据库中所有文档的元数据中提取和显示信息。如何提高Marklogic中的xdmp:document-filter()性能?
,我们正在使用这个查询: -
for $d in fn:doc()
return xdmp:document-filter(doc(fn:base-uri($d)))
有没有什么办法让这个查询工作更快或有任何替代xdmp:document-filter()
?
答
xdmp:document-filter()
通常在ETL时间使用。如果您使用Information Studio加载内容,则可以添加“筛选文档”转换。您可以选择将提取的元数据作为单独的xhtml文档存储,还可以选择为文档属性。这样,他们不需要在每次请求时即时计算。
HTH!