XML解析
1.XML解析思路
1.1DOM解析
DOM:Document Object Model 文件对象模型
把XML整个文件看做一个Document对象,每一个节点看做一个Element,节点中有Attribute,或者当前节点中存在Text文本内容。
DOM是将整个XML文件读取到计算机内存中,可以进行CRUD操作。
缺点:
占用了大量内存空间
适用的环境:
服务器对于XML文件的解析过程。
1.2SAX解析
逐行读取,给予一定的事件操作。
读取一行内容,释放上一行内容,可以有效的节约内存空间
缺点:
不能对XML文件,进行增删改
适用的环境:
手机读取解析XML文件时采用的方式。
2.DOM图例
3.XML文件解析工具
(1)JAXP:
SUN提供的一个基本的解析器,支持DOM和SAX两种解析方式,但是操作很繁琐,不便于程序员开发。
(2)Dom4j:
DOM For Java 一款非常优秀的解析器
Spring,SpringMVC… 框架中集成的XML解析器
(3)Jsoup:
基于Java完成的对于HTML解析的工具,因为HTML和XML文件都是标记语言。
给Jsoup一个URL,页面地址. Java的小爬虫,API很多很方便
(4)PULL:
Android手机上集成的XML解析工具,SAX方式解析
4. Dom4j使用入门
1.导包
目前使用的是第三方工具,不是原生的JDK
导入第三方Jar包
2. 设置IDEA
3. Dom4j涉及到的方法
SAXReader();
解析XML文件使用的核心类
read() --> XML文件Document对象
Document document = new SAXReader().read(new File("./xml/User.xml"));
对象中可以使用方法:
Element getRootElement();
获取当前XML文件的根节点对象
Element对象中可以使用方法:
List elements();
当前节点下的所有子节点
List elements(String name);
当前节点下所有指定名字的子节点
Element element();
获取当前节点下的第一个子节点
Element element(String name);
获取当前节点下指定名字的第一个子节点
Attribute getAttribute(String name);
根据属性名获取对应的属性对象Attribute
Attribute节点中可以使用String getValue()来获取对应的节点数据
String getName();
获取当前节点的名字
String getText();
获取当前节点对应的文本数据
import jdk.nashorn.internal.ir.CallNode;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;
import java.io.File;
import java.util.List;
/**
* @description Dom4j方法演示
* @author Anonymous
* @data 2020/3/6 15:07
*/
public class Demo1 {
public static void main(String[] args) throws DocumentException {
// 当前XML文件的Document对象
Document document = new SAXReader().read(new File("./xml/User.xml"));
// 获取根节点 Root Element
Element rootElement = document.getRootElement();
// 获取Root Element下子节点
List<Element> elements = rootElement.elements();
// 可以获取当前节点下的所有子节点
// System.out.println(elements);
Element teacher = rootElement.element("teacher");
// 获取属性节点指定属性值
System.out.println(teacher.attribute("id").getValue());
List<Element> elements1 = teacher.elements();
for (Element element : elements1) {
// 获取节点的名字
System.out.println(element.getName() + ":" + element.getText());
}
}
}
5. Dom4j Xpath解析读取XML文件
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.Node;
import org.dom4j.io.SAXReader;
import java.io.File;
import java.util.List;
/**
* @description Xpath语法解析 XML文件
* @author Anonymous
* @date 2020/3/6 15:55
*/
public class Demo3 {
public static void main(String[] args) throws DocumentException {
// 当前XML文件的Document对象
Document document = new SAXReader().read(new File("./xml/User.xml"));
// 获取根节点 Root Element
Element rootElement = document.getRootElement();
System.out.println("--------------------------------------");
System.out.println();
// //user[last()] 这里是不考虑路径关系,获取最后一个user节点
Node node = rootElement.selectSingleNode("//user[last()]");
System.out.println(node);
System.out.println("--------------------------------------");
System.out.println();
// //user[last()] 这里是不考虑路径关系,获取前两个User节点
List list = rootElement.selectNodes("//user[position() < 3]");
for (Object o : list) {
System.out.println(o);
}
System.out.println("--------------------------------------");
System.out.println();
// //name | // age 无视路径关系,获取所有的name节点和age节点
List list1 = rootElement.selectNodes("//name | // age");
for (Object o : list1) {
Element element = (Element) o;
System.out.println(element.getText());
}
}
}
6.XML文件保存
流程:
1. 创建Document对象
2. 通过Document对象来添加元素
addElment();
addAttribute();
import org.dom4j.Document;
import org.dom4j.DocumentHelper;
import org.dom4j.Element;
import org.dom4j.io.OutputFormat;
import org.dom4j.io.XMLWriter;
import java.io.FileWriter;
import java.io.IOException;
/**
* @description: 创建XML文件
* @author: Anonymous
* @time: 2020/3/6 16:29
*
* <students>
* <student id="qf1">
* <name>骚磊</name>
* <age>fdasfdsaf</age>
* <sex>male</sex>
* </student>
* <student id="qf2">
* <name>骚磊</name>
* <age>16</age>
* <sex>male</sex>
* </student>
* </students>
*/
public class Demo1 {
public static void main(String[] args) throws IOException {
// 1. 创建了一个XML文件对应的Document对象
Document document = DocumentHelper.createDocument();
// 2. 放入到XML文件对应的Document对象中
Element root = document.addElement("students");
// 3. 在根节点之下添加了一个student节点,同时设置了属性
Element element = root.addElement("student").addAttribute("id", "qf1");
// 根节点下添加了对应的子节点,以及对应的文本
element.addElement("name").addText("骚磊");
element.addElement("age").addText("16");
element.addElement("sex").addText("male");
// 字符输出流
FileWriter fileWriter = new FileWriter("./xml/student.xml");
document.write(fileWriter);
// 4. 关闭资源
fileWriter.close();
}
}