从clob列中提取xml时出错
问题描述:
我在包含xml数据的表中有一个Clob列。 我试图通过编写一个查询来提取数据:从clob列中提取xml时出错
select XMLTYPE.createxml(e.cdxml_index).extract('//page/fragment/text()') from chemical_structures e where e.primary_key=20;
错误消息我得到的是:
错误报告: SQL错误:ORA-31020:操作是不允许的,原因:安全原因,服务器端不允许通过XDB存储库进行ftp和http访问 ORA-06512:在“SYS.XMLTYPE”,第5行 31020. 00000 - “操作不被允许,原因:%s” *原因:尝试的操作不被允许 *操作:查看原因并切换到有效操作。
数据在CLOB列如下:
(CLOB) <?xml version="1.0" ?>
<!DOCTYPE CDXML SYSTEM "http://www.***.com/xml/cdxml.dtd" >
<CDXML
<page
id="12"
BoundingBox="0 0 540 719.75"
><fragment
id="9"
BoundingBox="91.5 111.75 104.01 123.21"
><n
id="8"
p="94.94 117.6"
Z="2"
Element="35"
NumHydrogens="0"
Charge="-1"
AS="N"
><t
id="7"
p="91.5 121.5"
BoundingBox="91.5 111.75 104.01 123.21"
><s font="3" size="10" face="96">Br-</s></t></n></fragment></page></CDXML>
我在一个论坛上说是有事情做在XML中的DOCTYPE声明读。
任何人都可以提出一种方法,我可以使它的工作?
谢谢
答
我找到了解决方法。
我不得不禁用xml dtd验证,但在尝试了几个在各种讨论板上提到的事情后没有工作。
最后我决定忽略xml中的doctype声明。为此,我使用了REGEXP_REPLACE方法。
下面的查询给了我什么,我一直在寻找:
select extract(XMLTYPE(REGEXP_REPLACE(e.cdxml_index, '<!DOCTYPE CDXML SYSTEM "http://***/xml/cdxml.dtd" >', '')),'//page/fragment/n') from chemical_structures e where e.primary_key=20;
我得到以下输出:
<n
id="8"
p="94.94 117.6"
Z="2"
Element="35"
NumHydrogens="0"
Charge="-1"
AS="N"
><t
id="7"
p="91.5 121.5"
BoundingBox="91.5 111.75 104.01 123.21"
><s font="3" size="10" face="96">Br-</s></t></n>