xml解析器

xml只是一个文本文件，无论内容存储的是什么数据，总是需要被应用程序来使用。所以应用程序是依赖xml文件，应用程序就需要读取xml文件，并解析它，但xml解析并不很方便，我们需要使用xml解析器。

DOM和SAX

它们是思想，是可以跨语言的。

DOM：文档对象模型，它由W3C提供。
SAX： xml简单的API

DOM原理

在解析XML文档之后，把所有的xml中数据保存到一组对象中。包含到Document中，可以通过Document对象来获取其中数据。

SAX原理

没有解析结果，在解析过程中来处理数据，而DOM是解析后的结果，即Document，所有数据都在Documentt，然后数据都在Document，然后处理数据使用Document完成，SAX是基于事件驱动的，当解析过程中，在特定事件引发时，来调用接口中的特定方法，在开始SAX解析之前用户需要给SAX提供接口实现类。

SAX和DOM优缺点

优点：SAX适合解析大xml文件（内存空间占用小），因为是解析一行处理一行，处理完了就不需要保留数据
缺点：SAX因为是解析一行处理一行，解析之后数据就丢失了，所以元素与元素之间的结构关系没有保留下来。

DOX和SAX在java中只是一组接口，儿实现类由第三方提供。例如：Apache xerces.jar就是DOM和SAX的实现。
我们的应用程序使用了A公司的解析器，然后又想更换为B公司的解析器，那么需要修改应用程序，这就说明耦合过于太紧，java提供了JAXP，使我们的应用程序与第三方的解析器接耦。
这里写图片描述
如果没有提供解析器，JAXP还有自己默认的解析器。

JAXP之DOM解析

1、得到解析器对象
2、使用解析器来解析指定的xml，得到Document.

//创建工厂
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
//得到解析器
DocumentBuilder  builder=factory.newDocumentBuilder();
//解析指定的xml文件，得到Documnet
Documnet doc=builder.parse(new File("src/students.xml"));

代码：
Demol.java

package com.me.jaxp;

import java.io.File;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;

import org.junit.Test;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;

public class Demol1 {
    @Test
    public void fun1() throws Exception{
        /*
         * 得到Document
         * 1.创建工厂
         * 2.通过工厂得到解析器
         * 3.通过解析器来解析xml，得到Document
         */
        DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();
        //自己不提供，使用默认的。
        DocumentBuilder builder=factory.newDocumentBuilder();
        Document document=builder.parse(new File("src/students.xml"));
        ///////////////////////////////////////////////////////////////
        /*
         * 遍历Document
         * 1.从Document中获取根元素，即文档元素。
         * 2.通过root元素获取它的所有子元素
         */
        Element root=document.getDocumentElement(); 
        NodeList stuNodeList= root.getElementsByTagName("student");

        /*
         * 3.循环遍历stuNodeList,获取每个student元素
         */ 
        for(int i=0;i < stuNodeList.getLength(); i++) {
            Node node=stuNodeList.item(i);
            Element  stuEle= (Element) node;//因为stuNodeList中都是学生元素，所以可以强转
            //获取stuEle元素中名称为number属性的值。
            String number=stuEle.getAttribute("number");
            //获取stuEle的所有名为name的 子元素，返回值为NodeLiset
            //再调用NodeList的item(0),因为我们知道一个学生元素最多就一个name子元素
            //调用name子元素的getTextContent()来获取name元素的文本内容。
            String name=stuEle.getElementsByTagName("name").item(0).getTextContent();
            String age=stuEle.getElementsByTagName("age").item(0).getTextContent();
            String sex=stuEle.getElementsByTagName("sex").item(0).getTextContent();

            System.out.println(number+","+age+","+sex);
        }
    }
}

students.xml

<?xml version="1.0" encoding="UTF-8"?>
<students>
    <student number="ITCAST_1001">
        <name>zhangSan</name>
        <age>23</age>
        <sex>male</sex>
    </student>
     <student number="ITCAST_1002">
        <name>liSi</name>
        <age>24</age>
        <sex>female</sex>
    </student>
</students>

结果：
ITCAST_1001,23,male ITCAST_1002,24,female

JAXP之SAX

1、得到工厂
2、通过工厂得到解析器
3、让解析去解析指定的 xml，不只是需要xml文件，还需要一个接口的实现。

class MyHandler extends DefaultHandler {
    public void startDocument() {
        System.out.println("开始解析");
    }
    public void startElement(String qName) {
        System.out.println("开始解析一个元素，元素名为"+qName);
    }
}

代码
Demol2.java

package com.me.jaxp;

import java.io.File;
import java.io.IOException;

import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;

import org.junit.Test;
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;

public class Demol2 {

    @Test
    public void fun1() throws Exception
    {
        /*
         * 1、创建工厂
         * 2、创建解析器
         * 3、给解析器提供xml和处理器，然后开始解析
         */
        SAXParserFactory factory=SAXParserFactory.newInstance();
        SAXParser parser = factory.newSAXParser();
        //解析方法需要两个参数，一个是xml文件，一个是处理器对象
        parser.parse(new File("src/students.xml"),new MyHandler());
    }

}
//自定义SAX的处理器，这里的方法会在解析的过程中被调用！
class MyHandler extends DefaultHandler
{

    @Override
    public void startDocument() throws SAXException {
        System.out.println("开始解析....");
    }

    @Override
    public void endDocument() throws SAXException {
        System.out.println("解析结束....");
    }


    @Override
    public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
        System.out.println("开始解析元素"+qName);
    }

    @Override
    public void endElement(String uri, String localName, String qName) throws SAXException {
        System.out.println("结束解析元素"+qName);
    }

    @Override
    public void characters(char[] ch, int start, int length) throws SAXException {
        String str =new String(ch, start, length);
        str.trim();//去空白有问题
        if(!str.isEmpty()){ 
            System.out.println(str);
        }
    }


}

students.xml

<?xml version="1.0" encoding="UTF-8"?>
<students>
    <student number="ITCAST_1001">
        <name>zhangSan</name>
        <age>23</age>
        <sex>male</sex>
    </student>
     <student number="ITCAST_1002">
        <name>liSi</name>
        <age>24</age>
        <sex>female</sex>
    </student>
</students>

Dom4j

相关Jar包:dom4j.jar、jaxen.jar,复制jar后要buildpath
这里写图片描述

相关操作

1、获取org.dom4j.Document
2、保存Document到xml文件中
3、遍历
4、添加
5、修改
6、删除
7、上面包含了查询

代码
Demol3.java

package com.me.jaxp;

import java.io.File;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.UnsupportedEncodingException;
import java.util.List;

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.OutputFormat;
import org.dom4j.io.SAXReader;
import org.dom4j.io.XMLWriter;
import org.junit.Test;


/**
 * Dom4j演示
 *
 */
public class Demol3 {

    /*
     * 得到Document
     */
    @Test
    public void fun1() throws Exception{
        //创建解析器
        SAXReader reader=new SAXReader();
        Document doc=reader.read(new File("src/students.xml"));
        System.out.println(doc.asXML());    
    }

    /*
     * 保存Document
     */
    @Test
    public void fun2() throws Exception  {
        //得到Document
        SAXReader reader=new SAXReader();
        Document doc=reader.read(new File("src/students.xml"));

        //保存Document
        XMLWriter writer=new XMLWriter(new FileOutputStream("src/student_copy.xml"));
        writer.write(doc);  
    }
    /*
     * 遍历Document
     */
    @Test
     public void fun3() throws Exception{
         SAXReader reader=new SAXReader();
         Document doc=reader.read(new File("src/students.xml"));

         //---------------------------//
         //1、获取根元素
         Element root=doc.getRootElement();
         //2、获取根元素中所以student元素
         List<Element> stuEleList = root.elements("student");
         //3、循环遍历所有学生元素
         for(Element stuEle : stuEleList){
             //1、获取学生元素的number
             String number=stuEle.attributeValue("number");
             //2、获取学生元素名为name的子元素的文本内容
             String name=stuEle.elementText("name");
             String age=stuEle.elementText("age");
             String sex=stuEle.elementText("sex");

             System.out.println(number+","+name+","+age+","+sex); 
         } 
     }

     /*
      * 添加元素
      */
    @Test
     public void fun4() throws Exception{
        //得到Document
        SAXReader reader=new SAXReader();
        Document doc=reader.read(new File("src/students.xml"));

        //1、获取根元素
        Element root=doc.getRootElement();
        //2、给root元素添加一个名Ericstudent的子元素，并返回它
        /*
         * 三件事
         * *创建一个名为student的元素
         * *把这个元素添加到root中
         * *返回它
         */
        Element stuEle = root.addElement("student");
        //给stuEle添加属性，名为number,值为ITCAST_1003
        stuEle.addAttribute("number", "ITCAST_1003");
//      Element nameEle = stuEle.addElement("name");//此时name无值
//      nameEle.setText("WangWu");
        //给stuEle添加名为name的子元素，并为子元素设置文本内容为wangwu
        stuEle.addElement("name").setText("WangWu");
        stuEle.addElement("age").setText("17");
        stuEle.addElement("sex").setText("male");

//      //////////////////////////////////
//      /*//设置保存的格式化器
//      /*参数说明
//       * 1、\t：使用什么来完成缩进
//       * 2、是否换行
//       */
//      OutputFormat format = new OutputFormat("\t",true);
//      //把文档中原有的空白去掉
//      format.setTrimText(true);
//      //保存Document
//      //在创建writer时，知道格式化器
//      XMLWriter writer=new XMLWriter(new FileOutputStream("src/student_copy.xml"),format);
//      writer.write(doc);
        //保存Document
        //在创建writer时，知道格式化器
        XMLWriter writer=new XMLWriter(new FileOutputStream("src/student_copy.xml"));
        writer.write(doc);
     }

     /*
      * 修改元素
      */
    @Test
     public void fun5() throws Exception{
         /*
          * XPath
          */
        //得到Document
        SAXReader reader=new SAXReader();
        Document doc=reader.read(new File("src/student_copy.xml"));

        ///////////
        /*
         * 找到number为ITCAST_1003的student元素
         * 修改它的age子元素内容为81
         * 修改它的sex子元素内容为female
         */

        //1、使用XPath找到符合条件的子元素
        //查找student元素，条件是number子元素的属性为ITCAST_1003
        Element stuEle = (Element) doc.selectSingleNode("//student[@number='ITCAST_1003']");
        //2、修改stuEle的age子元素内容为81
        stuEle.element("age").setText("81");
        stuEle.element("sex").setText("female");

        XMLWriter writer=new XMLWriter(new FileOutputStream("src/student_copy.xml"));
        writer.write(doc);

     }

     /*
      * 删除元素
      */
    @Test
     public void fun6() throws Exception{

         /*
          * XPath
          */
        //得到Document
        SAXReader reader=new SAXReader();
        Document doc=reader.read(new File("src/student_copy.xml"));

        ///////////
        /*
         * 找到number为ITCAST_1003的student元素
         * 修改它的age子元素内容为81
         * 修改它的sex子元素内容为female
         */

        //1、使用XPath找到符合条件的子元素
        //查找student元素，条件是name子元素的文本内容为WangWu
        Element stuEle = (Element) doc.selectSingleNode("//student[name='WangWu']");



        //2、获取父元素，使用父元素删除指定子元素
        stuEle.getParent().remove(stuEle);

        XMLWriter writer=new XMLWriter(new FileOutputStream("src/student_copy.xml"));
        writer.write(doc);

     }
}

xml解析器

xml解析器

DOM和SAX

DOM原理

SAX原理

SAX和DOM优缺点

JAXP之DOM解析

JAXP之SAX

Dom4j

相关操作

猜你喜欢