XML:DOM解析

版权声明:赠人玫瑰,手有余香!本文是小哥哥的原创文章,转载或摘抄时请注明出处。 https://blog.csdn.net/lovecuidong/article/details/88575862

XML解析

CRUD : create retrieve update delete

XML解析方式分为两种:dom和sax

dom:(Document Object Model, 即文档对象模型) 是 W3C 组织推荐的处理 XML 的一种方式。

sax: (Simple API for XML) 不是官方标准,但它是 XML 社区事实上的标准,几乎所有的 XML 解析器都支持它。

XML解析器

Crimson、Xerces 、Aelfred2

XML解析开发包

Jaxp、Jdom、dom4j

特点

dom解析的优点是对文档crud比较方便,缺点是占用内存比较大。

sax解析的优点是占用内存少,解析速度快,缺点是只适合做文档的读取,不适合做文档cud。

注意

dom解析下,xml文档的每一个组成部分都会用一个对象表示,例如标签用Element,属性用Attr,但不管什么对象,都是Node的子类,所以在开发中可以把获取到的任意节点都当作Node对待。

JAXP

JAXP 开发包是J2SE的一部分,它由javax.xml、org.w3c.dom 、org.xml.sax 包及其子包组成。

在 javax.xml.parsers 包中,定义了几个工厂类,程序员调用这些工厂类,可以得到对xml文档进行解析的 DOM 或 SAX 的解析器对象。

使用JAXP进行DOM解析

javax.xml.parsers 包中的DocumentBuilderFactory用于创建DOM模式的解析器对象 , DocumentBuilderFactory是一个抽象工厂类,它不能直接实例化,但该类提供了一个newInstance方法 ,这个方法会根据本地平台默认安装的解析器,自动创建一个工厂的对象并返回。

//调用 DocumentBuilderFactory.newInstance() 方法得到创建 DOM 解析器的工厂。
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();

//调用工厂对象的 newDocumentBuilder方法得到 DOM 解析器对象。
DocumentBuilder builder = factory.newDocumentBuilder();

//调用 DOM 解析器对象的 parse() 方法解析 XML 文档,得到代表整个文档的 Document 对象,进行可以利用DOM特性对整个XML文档进行操作了。
Document document = builder.parse("src/test/NewFile.xml");

DOM编程

DOM模型(document object model)

DOM解析器在解析XML文档时,会把文档中的所有元素,按照其出现的层次关系,解析成一个个Node对象(节点)。

在dom中,节点之间关系如下:

  • 位于一个节点之上的节点是该节点的父节点(parent)
  • 一个节点之下的节点是该节点的子节点(children)
  • 同一层次,具有相同父节点的节点是兄弟节点(sibling)
  • 一个节点的下一个层次的节点集合是节点后代(descendant)
  • 父、祖父节点及所有位于节点上面的,都是节点的祖先(ancestor)

Node对象

Node对象提供了一系列常量来代表结点的类型,当开发人员获得某个Node类型后,就可以把Node节点转换成相应的节点对象(Node的子类对象),以便于调用其特有的方法。

Node对象提供了相应的方法去获得它的父结点或子结点。编程人员通过这些方法就可以读取整个XML文档的内容、或添加、修改、删除XML文档的内容了。

<!-- XML文档 -->
<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<中国>
	<北京 name="帝都">
		<东城>北大</东城>
		<西城>清华</西城>
	</北京>
	<上海>
		<浦东>复旦</浦东>
		<浦西>同济</浦西>
	</上海>
</中国>
//查找节点文本
@Test
public void read1() throws Exception {
    DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
    DocumentBuilder builder = factory.newDocumentBuilder();
    Document document = builder.parse("src/test/NewFile.xml");
    
    NodeList list = document.getElementsByTagName("浦西");
    Node node = list.item(0);
    String s = node.getTextContent();
    System.out.println(s);
}
//遍历所有节点
@Test
public void read2() throws Exception {
    DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
    DocumentBuilder builder = factory.newDocumentBuilder();
    Document document = builder.parse("src/test/NewFile.xml");
    
    // 得到根节点
    Node root = document.getElementsByTagName("北京").item(0);
    list(root);
}

private void list(Node node) {
    if (node instanceof Element) {
        System.out.println(node.getNodeName());
    }
    NodeList list = node.getChildNodes();
    for (int i = 0; i < list.getLength(); i++) {
        Node child = list.item(i);
        list(child);
    }
}
// 查找节点属性
@Test
public void read3() throws Exception {
    DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
    DocumentBuilder builder = factory.newDocumentBuilder();
    Document document = builder.parse("src/test/NewFile.xml");
    
    Element name = (Element) document.getElementsByTagName("北京").item(0);
    String value = name.getAttribute("name");
    System.out.println(value);
}
// 添加节点
@Test
public void addele() throws Exception {
    DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
    DocumentBuilder builder = factory.newDocumentBuilder();
    Document document = builder.parse("src/test/NewFile.xml");
    
    // 创建节点
    Element place = document.createElement("昌平");
    place.setTextContent("翡翠");
    // 得到参考节点
    Element refNode = (Element) document.getElementsByTagName("东城").item(0);
    // 得到要挂崽的节点
    Element baba = (Element) document.getElementsByTagName("北京").item(0);
    // 往北京节点指定位置插崽
    baba.insertBefore(place, refNode);
    
    // 把更新后内存写到xml文档
    TransformerFactory tff = TransformerFactory.newInstance();
    Transformer tf = tff.newTransformer();
    tf.transform(new DOMSource(document), new StreamResult(new FileOutputStream("src/test/NewFile.xml")));
}
// 添加节点属性
@Test
public void addatt() throws Exception {
    DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
    DocumentBuilder builder = factory.newDocumentBuilder();
    Document document = builder.parse("src/test/NewFile.xml");
    
    Element BJName = (Element) document.getElementsByTagName("北京").item(0);
    BJName.setAttribute("name", "一个人的北京");
    
    // 把更新后内存写到xml文档
    TransformerFactory tff = TransformerFactory.newInstance();
    Transformer tf = tff.newTransformer();
    tf.transform(new DOMSource(document), new StreamResult(new FileOutputStream("src/test/NewFile.xml")));
}
// 删除节点
@Test
public void delete() throws Exception {
    DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
    DocumentBuilder builder = factory.newDocumentBuilder();
    Document document = builder.parse("src/test/NewFile.xml");
    
    // 得到要删除的节点
    Element ez = (Element) document.getElementsByTagName("昌平").item(0);
    // 得到要删除节点的爸爸
    Element bb = (Element) document.getElementsByTagName("北京").item(0);
    // 爸爸删除儿子
    bb.removeChild(ez);
    
    // 把更新后内存写到xml文档
    TransformerFactory tff = TransformerFactory.newInstance();
    Transformer tf = tff.newTransformer();
    tf.transform(new DOMSource(document), new StreamResult(new FileOutputStream("src/test/NewFile.xml")));
}
// 更改节点文本
@Test
public void update() throws Exception {
    DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
    DocumentBuilder builder = factory.newDocumentBuilder();
    Document document = builder.parse("src/test/NewFile.xml");
    
    Element e = (Element) document.getElementsByTagName("东城").item(0);
    e.setTextContent("翡翠");
    
    // 把更新后内存写到xml文档
    TransformerFactory tff = TransformerFactory.newInstance();
    Transformer tf = tff.newTransformer();
    tf.transform(new DOMSource(document), new StreamResult(new FileOutputStream("src/test/NewFile.xml")));
}

更新XML文档

javax.xml.transform包中的Transformer类用于把代表XML文件的Document对象转换为某种格式后进行输出,例如把xml文件应用样式表后转成一个html文档。利用这个对象,当然也可以把Document对象又重新写入到一个XML文件中。

Transformer类通过transform方法完成转换操作,该方法接收一个源和一个目的地。我们可以通过:javax.xml.transform.dom.DOMSource类来关联要转换的document对象, 用javax.xml.transform.stream.StreamResult 对象来表示数据的目的地。

Transformer对象通过TransformerFactory获得。

TransformerFactory tff = TransformerFactory.newInstance();
Transformer tf = tff.newTransformer();
tf.transform(new DOMSource(document), new StreamResult(new FileOutputStream("src/test/NewFile.xml")));

猜你喜欢

转载自blog.csdn.net/lovecuidong/article/details/88575862