Xml学习（2）

1、CDATA区：

非法字符

严格的讲，在XML中仅有字符“<”和“&”是非法的。省略号、引号和大于号是合法的，但是把它们替换为实体引用是个好习惯。

< <

& &

如果某段字符串里面有过多的字符，并且里面包含了类似标签或者关键字的这种文字，不想让xml的解析器去解析，那么可以使用CDATA

<des><![CDATA[<a href="http://www.baidu.com">我爱Java</a>]]></des>

CDATA部分中的所有内容都会被解析器忽略。由"<![CDATA["开始，由“]]>”结束。CDATA一般比较少看到，通常在服务器给客户端返回数据的时候。

2、XML解析

>其实就是获取里面的字符数据或者属性数据。

3、XML解析方式（面试常问）

>有很多种，但是常用的有两种

>DOM：（document Object model）把所有文档全部读取到内存当中形成树结构，整个文档称之为document对象，属性对应Attribute对象，所有元素节点对应Element对象，文本称之为Text对象，以上所有对象称之为Node节点。如果xml特别大，则造成内存溢出，可以对文档进行增删。

Xml学习（2）

>SAX：Simple API for xml ，基于事件驱动，读取一行，解析一行。不会造成内存溢出，不可以进行增删，只能查询。

针对这两种解析方式的API

jaxp(sun公司，比较繁琐)、jdom、dom4j(使用比较广泛)

4、Dom4j基本用法

1）创建SaxReader对象、

2）指定解析的xml

3）获取根元素

4）根据根元素获取子元素或者下面的子孙元素

try {
            //1. 创建sax读取对象
            SAXReader reader = new SAXReader(); //jdbc -- classloader
            //2. 指定解析的xml源
            Document  document  = reader.read(new File("src/xml/stus.xml"));            
            //3. 得到元素、
            //得到根元素
            Element rootElement= document.getRootElement();
            
            //获取根元素下面的子元素 age
            //rootElement.element("age") 
            //System.out.println(rootElement.element("stu").element("age").getText());


            //获取根元素下面的所有子元素 。 stu元素
            List<Element> elements = rootElement.elements();
            //遍历所有的stu元素
            for (Element element : elements) {
                //获取stu元素下面的name元素
                String name = element.element("name").getText();
                String age = element.element("age").getText();
                String address = element.element("address").getText();
                System.out.println("name="+name+"==age+"+age+"==address="+address);
            }            
        } catch (Exception e) {
            e.printStackTrace();
        }

5、Dom4j的Xpath使用

>dom4j里面支持Xpath的写法。xpath其实是xml的路劲语言，支持我们在解析xml的时候，能够快速的定位到具体的某一个元素

1）添加jar包依赖 jaxen-1.1-beta-6.jar

2）在查找指定节点的时候，根据XPath语法规则来查找

3）后续的代码与以前的·解析代码一样。

 //要想使用Xpath， 还得添加支持的jar 获取的是第一个 只返回一个。 
            Element nameElement = (Element) rootElement.selectSingleNode("//name");
            System.out.println(nameElement.getText());


            System.out.println("----------------");

            //获取文档里面的所有name元素 
            List<Element> list = rootElement.selectNodes("//name");
            for (Element element : list) {
                System.out.println(element.getText());
            }

相关推荐