搜索在marklogic二进制文件

搜索在marklogic二进制文件

问题描述:

有什么搜索类似PPT的二进制文件内容的方法,PDF等比搜索在marklogic二进制文件

使用xdmp它转换成X HTML格式其他:文件过滤器()函数,并在其上搜索?

基本没有。您必须从二进制格式中提取可读文本,以便MarkLogic对其进行索引。您可以使用xdmp:document-filter()或使用xdmp:pdf-convert()xdmp:word-convert()之类的函数提取该文本,但无法直接为二进制节点建立索引。

HTH!