Java学习4-8_XML学习

XML

XML 指可扩展标记语言(eXtensible Markup Language)。被设计用来传输和存储数据。

一、特性

  1. xml具有平台无关性,是一门独立的标记语言
  2. xml具有自我描述性

二、作用

  1. 网络数据传输
  2. 数据存储
  3. 配置文件

三、XML树结构

XML 文档形成了一种树结构,它从"根部"开始,然后扩展到"枝叶"。

<?xml version="1.0" encoding="UTF-8"?>
<note>
	<to>Qs</to>
	<from>Sky</from>
	<heading>Reminder</heading>
	<body>Don't forget to date this weekend!</body>
</note>

第一行是xml声明,定义 XML 的版本(1.0)和所使用的编码(UTF-8 : 万国码, 可显示各种语言)。

四、语法点

  1. 对大小写敏感

  2. XML 文档必须有根元素

  3. 所有 XML 元素都必须有一个关闭标签

  4. XML 属性值必须加引号

  5. 实体引用

    实体 字符 描述
    &lt; < less than
    &gt; > greater than
    &amp; & ampersand
    &apos; apostrophe
    &quot; " quotation mark

    在 XML 中,只有字符 “<” 和 “&” 确实是非法的。大于号是合法的,但是用实体引用来代替它是一个好习惯。

  6. XML 中的注释

    <!-- This is a comment -->

  7. 在 XML 中,空格会被保留,HTML 会把多个连续的空格字符裁减(合并)为一个

  8. XML 以 LF 存储换行

    1. 在 Windows 应用程序中,换行通常以一对字符来存储:回车符(CR)和换行符(LF)。
    2. 在 Unix 和 Mac OSX 中,使用 LF 来存储新行。
    3. 在旧的 Mac 系统中,使用 CR 来存储新行。
    4. XML 以 LF 存储换行。
  9. XML 命名规则

    1. 名称可以包含字母、数字以及其他的字符
    2. 名称不能以数字或者标点符号开始
    3. 名称不能以字母 xml(或者 XML、Xml 等等)开始
    4. 名称不能包含空格
    5. 标记名称允许重复
  10. XML 元素是可扩展的,XML 的优势之一,就是可以在不中断应用程序的情况下进行扩展

五、Java中有XML解析方式

5.1 SAX解析

  1. 解析方式是事件驱动机制!
  2. SAX解析器,逐行读取XML文件解析,每当解析到一个标签的开始/结束/内容/属性时,触 发事件
  3. 我们可以编写程序在这些事件发生时,进行相应的处理

缺点:

  1. 单向解析,无法定位文档层次,无法同时访问同一文档的不同部分数据(因为逐 行解析,当解析第n行是,第n-1行已经被释放了,无法在进行操作了)。
  2. 无法得知事件发生时元素的层次, 只能自己维护节点的父/子关系
  3. 只读解析方式,无法修改XML文档的内容。

5.2 DOM解析

是用与平台和语言无关的方式表示XML文档的官方W3C标准,分析该结构通常需要加载整个 文档和内存中建立文档树模型.程序员可以通过操作文档树, 来完成数据的获取 修改 删除等

优点:

  1. 文档在内存中加载,允许对数据和结构做出更改
  2. 双向访问,可以在任何时候在树中双向解析数据。

缺点:文档全部加载在内存中,消耗资源大

5.3 JDOM解析

  1. 目的是成为Java特定文档模型,它简化与XML的交互并且比使用DOM实现更快。由于是第一 个Java特定模型,JDOM一直得到大力推广和促进
  2. JDOM文档声明其目的是“使用20%(或更少)的精力解决80%(或更多)Java/XML问题” (根据学习曲线假定为20%)

缺点:没有较好的灵活性;没有较好的灵活性。

5.4 DOM4J解析

它是JDOM的一种智能分支。它合并了许多超出基本XML文档表示的功能,包括集成的XPath 支持、XML Schema支持以及用于大文档或流化文档的基于事件的处理。它还提供了构建文档表示的选项, DOM4J是一个非常优秀的Java XML API,具有性能优异、功能强大和极端易用使用的特点,同时它也是一 个开放源代码的软件。

5.5 DOM4J解析XML

步骤:

  1. 引入jar文件 dom4j.jar

  2. 创建一个指向XML文件的输入流

    FileInputStream fis = new FileInputStream("xml文件的地址");

  3. 创建一个XML读取工具对象

    SAXReader sr = new SAXReader();

  4. 使用读取工具对象, 读取XML文档的输入流,并得到文档对象

    Document doc = sr.read(fis);

  5. 通过文档对象,获取XML文档中的根元素对象

    Element root = doc.getRootElement();

5.5.1 文档对象 Document

指的是加载到内存的整个XML文档

常用方法:

  1. 通过文档对象, 获取XML文档中的根元素对象

    Element root = doc.getRootElement();

  2. 添加根节点

    Element root = doc.addElement("根节点名称");

5.5.2 元素对象 Element

指的是XML文档中的单个节点

常用方法:

  1. 获取节点名称

    String getName();

  2. 获取节点内容

    String getText();

  3. 设置节点内容

    String setText();

  4. 根据子节点的名称,获取匹配名称的第一个子节点对象

    Element element(String 子节点名称);

  5. 获取所有的子节点对象

    List elements();

  6. 获取节点的属性值

    String attributeValue(String 属性名称);

  7. 获取子节点的内容

    String elementText(String 子节点名称);

  8. 添加子节点

    Element addElement(String 子节点名称);

  9. 添加属性

    void addAttribute(String 属性名,String 属性值);

5.5.3 DOM4J - XPATH解析XML

  1. 路径表达式,通过路径快速的查找一个或一组元素

    1. ​ / : 从根节点开始查找

    2. ​ // : 从发起查找的节点位置 查找后代节点

    3. ​ . : 查找当前节点

    4. ​ … : 查找父节点

    5. @ : 选择属性

    属性使用方式:

    [@属性名='值']

    [@属性名>'值']

    [@属性名<'值']

    [@属性名!='值']

  2. 使用步骤

    //通过Node类的两个方法, 来完成查找:
    //(Node是 Document 与 Element 的父接口)
    //方法1.
    //根据路径表达式, 查找匹配的单个节点
    Element e = selectSingleNode("路径表达式");
    //方法2.
    List<Element> es = selectNodes("路径表达式");
    

5.6 Java生成XML

步骤:

  1. 通过文档帮助器 (DocumentHelper) , 创建空的文档对象

    Document doc = DocumentHelper.createDocument();

  2. 通过文档对象, 向其中添加根节点

    Element root = doc.addElement("根节点名称");

  3. 通过根节点对象root , 丰富我们的子节点

    Element e = root.addElement("元素名称");

  4. 创建一个文件输出流 ,用于存储XML文件

    FileOutputStream fos = new FileOutputStream("要存储的位置");

  5. 将文件输出流, 转换为XML文档输出流

    XMLWriter xw = new XMLWriter(fos);

  6. 写出文档

    xw.write(doc);

  7. 释放资源

    xw.close();

//1. 通过文档帮助器, 创建空的文档对象
Document doc = DocumentHelper.createDocument();
//2. 向文档对象中, 加入根节点对象
Element books = doc.addElement("books");
//3. 向根节点中 丰富子节点
for(int i=0;i<1000;i++) {
    
    
//向根节点中加入1000个book节点.
Element book = books.addElement("book");
//向book节点, 加入id属性
book.addAttribute("id", 1+i+"");
//向book节点中加入name和info节点
Element name = book.addElement("name");
Element info = book.addElement("info");
name.setText("苹果"+i);
info.setText("哈哈哈"+i);
}
//4. 创建文件的输出流
FileOutputStream fos = new FileOutputStream("c:\\books.xml");
//5. 将文件输出流 , 转换为XML文档输出流
XMLWriter xw = new XMLWriter(fos);
//6. 写出XML文档
xw.write(doc);
//7. 释放资源
xw.close();
System.out.println("代码执行完毕");

5.7 XStream 的使用

快速的将Java中的对象, 转换为 XML字符串

步骤:

  1. 创建XStream 对象

    XStream x = new XStream();

  2. 修改类生成的节点名称 (默认节点名称为 包名.类名)

    x.alias("节点名称",类名.class);

  3. 传入对象 , 生成XML字符串

    String xml字符串 = x.toXML(对象);

Person p = new Person(1001, "张三", "不详");
XStream x = new XStream();
x.alias("haha", Person.class);
String xml = x.toXML(p);
System.out.println(xml);

猜你喜欢

转载自blog.csdn.net/Sky_Coolssy/article/details/108924758