Dom4j解析器_解析xml文档

目录
    1、Dom4J是什么
    2、使用dom4j解析xml
    3、使用dom4j查询xml
    4、使用dom4j实现 添加操作
    5、使用dom4j实现在 特定位置 添加元素
    6、使用dom4j实现 修改节点的操作
    7、使用dom4j实现 删除节点的操作
    8、使用dom4j获取 属性的操作
================================================================
1、Dom4J是什么
    DOM4J是针对Java开发人员专门提供的XML文档解析规范，它不同与DOM，但与DOM相似。DOM4J针对Java开发人员而设计，所以对于Java开发人员来说，使用DOM4J要比使用DOM更加方便。
DOM4J对DOM和SAX提供了支持，使用DOM4J可以把org.dom4j.document转换成org.w3c.Document，DOM4J也支持基于SAX的事件驱动处理模式。
使用者需要注意，DOM4J解析的结果是org.dom4j.Document，而不是org.w3c.Document。DOM4J与DOM一样，只是一组规范（接口与抽象类组成），底层必须要有DOM4J解析器的实现来支持。
DOM4J使用JAXP来查找SAX解析器，然后把XML文档解析为org.dom4j.Document对象。它还支持使用org.w3c.Document来转换为org.dom4j.Docment对象。

2、使用dom4j解析xml
    * dom4j，是一个组织，针对xml解析，提供解析器 dom4j
    * dom4j不是javase的一部分，想要使用第一步需要怎么做？
    *** 导入dom4j提供jar包
        -- 创建一个文件夹 lib
        -- 复制jar包到lib下面，（dom4j-1.6.1.jar）
        -- 右键点击jar包，build path -- add to build path
        -- 看到jar包，变成奶瓶样子，表示导入成功

    * 得到Document对象
        SAXReader reader = new SAXReader();
        Document document = reader.read(url);
    * Document接口 的父接口是Node
    * 如果在 Document 里面找不到想要的方法，到Node里面去找
        - Document 里面的方法 getRootElement() ：获取根节点 返回的是Element对象。
    * Element也是一个接口，父接口是Node
        - Element和Node里面方法
            ** getParent()：获取父节点
            ** addElement：添加标签
            ** element(标签的名称)
                ** 获取标签下面是 这个标签名 的 第一个 子标签。
            ** elements(标签的名称)
                ** 获取标签下面是 这个标签名 的 所有 一层子标签。
            ** elements()
                ** 获取标签下面的 所有 一层子标签。

3、使用dom4j查询xml
    * 解析是从上到下解析
    * 查询所有name元素里面的值
        /*
            1、创建解析器
            2、得到document
            3、得到根节点  getRootElement() 返回Element

            4、得到所有的p1标签
                * elements("p1") 返回list集合
                * 遍历list得到每一个p1
            5、得到name
                * 在p1下面执行 element("name")方法 返回Element
            6、得到name里面的值
                * getText方法得到值
        */
        //创建解析器
        SAXReader saxReader = new SAXReader();
        //得到document
        Document document = saxReader.read("src/p1.xml");
        //得到根节点
        Element root = document.getRootElement();

        //得到根节点下面一层的所有 p1元素
        List<Element> list = root.elements("p1");
        //遍历list
        for (Element element : list) {
            //得到p1下面的name元素
            Element name1 = element.element("name");
            //得到name里面的文本值
            String s = name1.getText();
            System.out.println(s);
        }

    * 查询第一个name元素的值
        /*
        * 1、创建解析器
        * 2、得到document
        * 3、得到根节点
        *
        * 4、得到第一个p1元素
            ** element("p1")方法 返回Element
        * 5、得到p1下面的第一个name元素
            ** element("name")方法 返回Element
        * 6、得到name元素里面的值
            ** getText方法
        * */

    * 获取第二个name元素的值
        /*
        * 1、创建解析器
        * 2、得到document
        * 3、得到根节点
        *
        *  4、得到所有的p1
            ** elements("p1"); 返回 list集合
        *  5、遍历得到第二个p1
            ** 使用list下标得到 get方法，集合的下标从 0 开始，想要得到第二个值，下标写 1
        *  6、得到第二个p1下面的name
            ** element("name")方法 返回Element
        *  7、得到name的值
            ** getText方法
        * */

4、使用dom4j实现 添加操作
    * 在第一个p1标签末尾添加一个元素 <sex>nv</sex>
    * 步骤
        /*
        * 1、创建解析器
        * 2、得到document
        * 3、得到根节点
        *
        * 4、获取到第一个p1
            * 使用element方法
        * 5、在p1下面添加元素
            * 在p1上面直接使用 addElement("标签名称")方法 返回一个Element

        * 6、在添加完成之后的元素下面添加文本
            * 在sex上直接使用 setText("文本内容")方法
        * 7、回写xml
            * 格式化 OutputFormat,使用 createPrettyPrint方法，表示一个漂亮的格式
            * 使用类XMLWriter 直接new 这个类 ，传递两个参数
                *** 第一个参数是xml文件路径 new FileOutputStream("路径")
                *** 第二个参数是格式化类的值
        * */
        //创建解析器
            SAXReader reader = new SAXReader();
        //得到document
            Document document = reader.read("src/p1.xml");
        //得到根节点
            Element root = document.getRootElement();
        //得到第一个p1元素
            Element p1 = root.element("p1");
        //在p1下面直接添加元素，返回值是添加的元素
            Element sex1 = p1.addElement("sex");
        //在sex下面添加文本
            sex1.setText("nv");
        //回写xml（以上的操作都是在对内存中的Document对象的处理，必须回写到硬盘上才能更改)
            // OutputFormat format = OutputFormat.createCompactFormat(); // 压缩格式的
            OutputFormat format = OutputFormat.createPrettyPrint(); //可以有缩进的效果
            XMLWriter  xmlWriter = new XMLWriter(new FileOutputStream("src/p1.xml"), format);
            xmlWriter.write(document);
            xmlWriter.close();

5、使用dom4j实现在 特定位置 添加元素
    * 在第一个p1下面的age标签之前添加 <school>ecit.edu.cn</schlool>
    * 步骤
        /*
        * 1、创建解析器
        * 2、得到document
        * 3、得到根节点
        * 4、获取到第一个p1
        *
        * 5、获取p1下面的所有的元素
            ** elements()方法 返回 list集合

            ** 使用list里面的方法，在特定位置添加元素
            ** 首先创建元素 在元素下面创建文本
                - 使用DocumentHelper类方法createElement创建标签
                - 把文本添加到标签下面 使用 setText("文本内容")方法
           ** list集合里面的 add(int index, E element)
              - 第一个参数是 位置 下标，从0开始
              - 第二个参数是 要添加的元素
        * 6、回写xml
        * */

        //创建解析器
            SAXReader saxReader = new SAXReader();
        //得到document
           Document document = saxReader.read("src/p1.xml");
        //得到根节点
            Element root = document.getRootElement();
        //获取到第一个p1
            Element p1 = root.element("p1");
        //获取p1下面的所有元素
            List<Element> p1_childList = p1.elements();
        //创建元素 使用DocumentHelper。末尾添加不用，指定位置添加要创建元素。
            Element school = DocumentHelper.createElement("school");
        //在school下面创建文本
            school.setText("ecit");
        //在特定位置添加
            p1_childList.add(1, school);
        //回写xml
            OutputFormat format = OutputFormat.createPrettyPrint();
            XMLWriter xmlWriter = new XMLWriter(new FileOutputStream("src/p1.xml"), format);
            xmlWriter.write(document);
            xmlWriter.close();

    ** 可以对得到document的操作和 回写xml的操作，封装成方法
    ** 也可以把传递的文件路径，封装成一个常量
    *** 好处：可以提高开发速度，可以提交代码可维护性
    - 比如想要修改文件路径（名称），这个时候只需要修改常量的值就可以了，其他代码不需要做任何改变

6、使用dom4j实现 修改节点的操作
    * 修改第一个p1下面的age元素的值 <age>30</age>
    * 步骤
        /*
        * 1、得到document
        * 2、得到根节点，然后再得到第一个p1元素
        * 3、得到第一个p1下面的age
                element("age")方法
        * 4、修改值是 30
               使用setText("文本内容")方法
        * 5、回写xml
        * */

7、使用dom4j实现 删除节点的操作
    * 删除第一个p1下面的<school>ecit</school>元素
    * 步骤
        /*
        * 1、得到document
        * 2、得到根节点
        * 3、得到第一个p1标签
        * 4、得到第一个p1下面的school元素

        * 5、删除（使用p1删除school）
                得到school的父节点
            - 第一种直接得到p1
            - 使用方法 getParent()方法得到
            * 删除操作
                - 在p1上面执行remove方法删除节点
        * 6、回写xml
        * */

8、使用dom4j获取 属性的操作
    * 获取第一个p1里面的属性id1的值
    * 步骤
        /*
        * 1、得到document
        * 2、得到根节点
        * 3、得到第一个p1元素
        * 4、得到p1里面的属性值
            - p1.attributeValue("id1");
            - 在p1上面执行这个方法，里面的参数是属性名称
        * */
Dom4j解析器_解析xml文档

猜你喜欢