XML解析

1.XML解析思路

1.1DOM解析

        DOM：Document Object Model 文件对象模型
        把XML整个文件看做一个Document对象，每一个节点看做一个Element，节点中有Attribute，或者当前节点中存在Text文本内容。
        DOM是将整个XML文件读取到计算机内存中，可以进行CRUD操作。
缺点:
        占用了大量内存空间
适用的环境：
        服务器对于XML文件的解析过程。

1.2SAX解析

        逐行读取，给予一定的事件操作。
        读取一行内容，释放上一行内容，可以有效的节约内存空间
缺点:
        不能对XML文件，进行增删改
适用的环境:
        手机读取解析XML文件时采用的方式。

2.DOM图例

在这里插入图片描述

3.XML文件解析工具

（1）JAXP：
         SUN提供的一个基本的解析器，支持DOM和SAX两种解析方式，但是操作很繁琐，不便于程序员开发。
（2）Dom4j：
        DOM For Java 一款非常优秀的解析器
Spring，SpringMVC… 框架中集成的XML解析器
（3）Jsoup：
        基于Java完成的对于HTML解析的工具，因为HTML和XML文件都是标记语言。
        给Jsoup一个URL，页面地址. Java的小爬虫，API很多很方便
（4）PULL：
        Android手机上集成的XML解析工具，SAX方式解析

4. Dom4j使用入门

1.导包
目前使用的是第三方工具，不是原生的JDK
导入第三方Jar包
2. 设置IDEA
3. Dom4j涉及到的方法
        SAXReader();
                解析XML文件使用的核心类
                read() --> XML文件Document对象
Document document = new SAXReader().read(new File("./xml/User.xml"));

对象中可以使用方法：
                Element getRootElement();
                        获取当前XML文件的根节点对象
Element对象中可以使用方法：
        List elements();
                当前节点下的所有子节点
        List elements(String name);
                当前节点下所有指定名字的子节点
        Element element();
                获取当前节点下的第一个子节点
        Element element(String name);
                获取当前节点下指定名字的第一个子节点
        Attribute getAttribute(String name);
                根据属性名获取对应的属性对象Attribute
                Attribute节点中可以使用String getValue()来获取对应的节点数据
        String getName();
                获取当前节点的名字
        String getText();
                获取当前节点对应的文本数据

import jdk.nashorn.internal.ir.CallNode;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;

import java.io.File;
import java.util.List;

/**
 * @description Dom4j方法演示
 * @author Anonymous
 * @data 2020/3/6 15:07
 */
public class Demo1 {
    public static void main(String[] args) throws DocumentException {

        // 当前XML文件的Document对象
        Document document = new SAXReader().read(new File("./xml/User.xml"));

        // 获取根节点 Root Element
        Element rootElement = document.getRootElement();

        // 获取Root Element下子节点
        List<Element> elements = rootElement.elements();
        // 可以获取当前节点下的所有子节点
        // System.out.println(elements);
        Element teacher = rootElement.element("teacher");

        // 获取属性节点指定属性值
        System.out.println(teacher.attribute("id").getValue());
        List<Element> elements1 = teacher.elements();
        for (Element element : elements1) {
            // 获取节点的名字
            System.out.println(element.getName() + ":" + element.getText());
        }
    }
}

5. Dom4j Xpath解析读取XML文件

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.Node;
import org.dom4j.io.SAXReader;

import java.io.File;
import java.util.List;

/**
 * @description Xpath语法解析 XML文件
 * @author Anonymous
 * @date 2020/3/6 15:55
 */
public class Demo3 {
    public static void main(String[] args) throws DocumentException {
        // 当前XML文件的Document对象
        Document document = new SAXReader().read(new File("./xml/User.xml"));

        // 获取根节点 Root Element
        Element rootElement = document.getRootElement();

        System.out.println("--------------------------------------");
        System.out.println();
        // //user[last()] 这里是不考虑路径关系，获取最后一个user节点
        Node node = rootElement.selectSingleNode("//user[last()]");
        System.out.println(node);

        System.out.println("--------------------------------------");
        System.out.println();
        // //user[last()] 这里是不考虑路径关系，获取前两个User节点
        List list = rootElement.selectNodes("//user[position() < 3]");
        for (Object o : list) {
            System.out.println(o);
        }

        System.out.println("--------------------------------------");
        System.out.println();

        // //name | // age 无视路径关系，获取所有的name节点和age节点
        List list1 = rootElement.selectNodes("//name | // age");
        for (Object o : list1) {
            Element element = (Element) o;
            System.out.println(element.getText());
        }
    }
}

6.XML文件保存

流程：
        1. 创建Document对象
        2. 通过Document对象来添加元素
                addElment();
                addAttribute();

import org.dom4j.Document;
import org.dom4j.DocumentHelper;
import org.dom4j.Element;
import org.dom4j.io.OutputFormat;
import org.dom4j.io.XMLWriter;

import java.io.FileWriter;
import java.io.IOException;

/**
 * @description: 创建XML文件
 * @author: Anonymous
 * @time: 2020/3/6 16:29
 *
 * <students>
 *     <student id="qf1">
 *         <name>骚磊</name>
 *         <age>fdasfdsaf</age>
 *         <sex>male</sex>
 *     </student>
 *     <student id="qf2">
 *         <name>骚磊</name>
 *         <age>16</age>
 *         <sex>male</sex>
 *     </student>
 * </students>
 */
public class Demo1 {
    public static void main(String[] args) throws IOException {
        // 1. 创建了一个XML文件对应的Document对象
        Document document = DocumentHelper.createDocument();

        // 2. 放入到XML文件对应的Document对象中
        Element root = document.addElement("students");

        // 3. 在根节点之下添加了一个student节点，同时设置了属性
        Element element = root.addElement("student").addAttribute("id", "qf1");
        // 根节点下添加了对应的子节点，以及对应的文本
        element.addElement("name").addText("骚磊");
        element.addElement("age").addText("16");
        element.addElement("sex").addText("male");

        // 字符输出流
        FileWriter fileWriter = new FileWriter("./xml/student.xml");
        document.write(fileWriter);
        // 4. 关闭资源
        fileWriter.close();
    }
}

qq_15400

发布了18 篇原创文章 · 获赞 32 · 访问量 1万+

私信关注

XML总结（二）