从clob列中提取xml时出错

问题描述:

我在包含xml数据的表中有一个Clob列。 我试图通过编写一个查询来提取数据:从clob列中提取xml时出错

select XMLTYPE.createxml(e.cdxml_index).extract('//page/fragment/text()') from chemical_structures e where e.primary_key=20; 

错误消息我得到的是:

错误报告: SQL错误:ORA-31020:操作是不允许的,原因:安全原因,服务器端不允许通过XDB存储库进行ftp和http访问 ORA-06512:在“SYS.XMLTYPE”,第5行 31020. 00000 - “操作不被允许,原因:%s” *原因:尝试的操作不被允许 *操作:查看原因并切换到有效操作。

数据在CLOB列如下:

(CLOB) <?xml version="1.0" ?> 
<!DOCTYPE CDXML SYSTEM "http://www.***.com/xml/cdxml.dtd" > 
<CDXML 
<page 
id="12" 
BoundingBox="0 0 540 719.75" 
><fragment 
id="9" 
BoundingBox="91.5 111.75 104.01 123.21" 
><n 
id="8" 
p="94.94 117.6" 
Z="2" 
Element="35" 
NumHydrogens="0" 
Charge="-1" 
AS="N" 
><t 
id="7" 
p="91.5 121.5" 
BoundingBox="91.5 111.75 104.01 123.21" 
><s font="3" size="10" face="96">Br-</s></t></n></fragment></page></CDXML> 

我在一个论坛上说是有事情做在XML中的DOCTYPE声明读。

任何人都可以提出一种方法,我可以使它的工作?

谢谢

我找到了解决方法。

我不得不禁用xml dtd验证,但在尝试了几个在各种讨论板上提到的事情后没有工作。

最后我决定忽略xml中的doctype声明。为此,我使用了REGEXP_REPLACE方法。

下面的查询给了我什么,我一直在寻找:

select extract(XMLTYPE(REGEXP_REPLACE(e.cdxml_index, '<!DOCTYPE CDXML SYSTEM "http://***/xml/cdxml.dtd" >', '')),'//page/fragment/n') from chemical_structures e where e.primary_key=20; 

我得到以下输出:

<n 
id="8" 
p="94.94 117.6" 
Z="2" 
Element="35" 
NumHydrogens="0" 
Charge="-1" 
AS="N" 
><t 
id="7" 
p="91.5 121.5" 
BoundingBox="91.5 111.75 104.01 123.21" 
><s font="3" size="10" face="96">Br-</s></t></n>