命名空间和xpath的libxml2错误
我在这里粘贴一些代码,在没有警告的情况下使用gcc file.c -lxml2编译,假定libxml2安装在您的系统中。命名空间和xpath的libxml2错误
#include <libxml/parser.h>
#include <libxml/xpath.h>
#include <assert.h>
#include <libxml/tree.h>
#include <libxml/xpathInternals.h>
xmlDocPtr
getdoc (char *docname) {
xmlDocPtr doc;
doc = xmlParseFile(docname);
if (doc == NULL) {
fprintf(stderr,"Document not parsed successfully. \n");
return NULL;
}
return doc;
}
xmlXPathObjectPtr
getnodeset (xmlDocPtr doc, xmlChar *xpath){
xmlXPathContextPtr context;
xmlXPathObjectPtr result;
context = xmlXPathNewContext(doc);
if (context == NULL) {
printf("Error in xmlXPathNewContext\n");
return NULL;
}
if(xmlXPathRegisterNs(context, BAD_CAST "new", BAD_CAST "http://www.example.com/new") != 0) {
fprintf(stderr,"Error: unable to register NS with prefix");
return NULL;
}
result = xmlXPathEvalExpression(xpath, context);
xmlXPathFreeContext(context);
if (result == NULL) {
printf("Error in xmlXPathEvalExpression\n");
return NULL;
}
if(xmlXPathNodeSetIsEmpty(result->nodesetval)){
xmlXPathFreeObject(result);
printf("No result\n");
return NULL;
}
return result;
}
int
main(int argc, char **argv) {
char *docname;
xmlDocPtr doc;
xmlChar *xpath = (xmlChar*) "/new:book/section1";
xmlNodeSetPtr nodeset;
xmlXPathObjectPtr result;
int i;
xmlChar *keyword;
if (argc <= 1) {
printf("Usage: %s docname\n", argv[0]);
return(0);
}
docname = argv[1];
doc = getdoc(docname);
result = getnodeset (doc, xpath);
if (result) {
nodeset = result->nodesetval;
for (i=0; i < nodeset->nodeNr; i++) {
keyword = xmlNodeListGetString(doc, nodeset->nodeTab[i]->xmlChildrenNode, 1);
printf("keyword: %s\n", keyword);
xmlFree(keyword);
}
xmlXPathFreeObject (result);
}
xmlFreeDoc(doc);
xmlCleanupParser();
return (1);
}
我的问题是,我想分析下面的XML
<?xml version="1.0" encoding="UTF-8"?>
<book xmlns="http://www.example.com/new">
<section1>Sec_1</section1>
<section2>Sec_2</section2>
</book>
书元素定义元素内的命名空间。我想打印xpath/book/section1中的值,并返回NULL。当我试图返回名称空间下的元素时,我也会收到错误,例如/ new:book/section1
我假设我的代码失败,因为我没有正确使用名称空间前缀。我没有时间。能否请你帮忙?
这是默认命名空间的问题。要匹配您需要的路径/ new:tag/new:标签 等等
这是libXml库令人讨厌的故障。正如cateof指出,问题是默认的命名空间声明:
的xmlns = “http://www.example.com/new”
两个选择:
(1)摆脱声明中您的书签 或 (2)给它一个名称,并在您的标签中使用该名称。
例如
的xmlns:新= “http://www.example.com/new”
那么你的标签看起来都像:
新:书 新:SECTION1
等。
原来,当我从here, 发现它不是真正的libxml的失败,这是一个问题,因为libxml的正确遵循XML/XPATH规范。
但是,如果您控制了正在解析的xml文档,R Bourdeau提出的解决方案是正确的。
XPATH查询的上下文是独立的 xml文档中的命名空间限定符。默认名称空间强制所有子标签进入一个名称空间;他们不需要文档中的合格,但必须在xpath查询中被限定。幸运的是,您使用libXml将名称空间注册为new
,因此cateof的解决方案应该可以工作。
xmlXPathRegisterNs(context, BAD_CAST "new", BAD_CAST "http://www.example.com/new"
xmlChar *xpath = (xmlChar*) "/new:book/new:section1";
我在这里内联XML能见度:
<?xml version="1.0" encoding="UTF-8"?>
<book xmlns="http://www.example.com/new">
<section1>Sec_1</section1>
<section2>Sec_2</section2>
</book>
这是第一个与XPath和命名空间相关的答案,它实际上解释了发生了什么以及如何解决它。我衷心感谢你我的朋友。 – 2013-02-14 11:08:54
是否可以告诉'libxml',有些命名空间是默认/隐含的文档中的所有元素,以避免过度重复它,在XPath查询结束? – SasQ 2013-08-21 19:12:29