XML 概述 XML基本语法 XML约束和解析

XML 概述 XML基本语法 XML约束和解析

XML
1.概述
2.xml基本语法
3.xml约束和解析(重点)
在程序运行过程中,读取xml文档的数据—》解析
4.工厂模式— spring思想初探索
半成品软件,需要在此基础之上进行软件开发,提高效率
反射+动态代理+xml文档===框架

一 XML

1.1 概述

可扩展标记语言(EXtensible Markup Language),都是由W3C组织提供和维护

可扩展:标签可以自定义

<user></user> <student></student>

作用(功能)

* 存储数据
	1.作为配置文件(框架使用它)【重点】
	2.作为数据的载体,在网络中传输

XML与HTML区别

1. xml文档语法严格,html文档语言松散
2. xml文档自定义,html文档是预定义
3. xml文档存储数据,html文档展示数据

1.2 快速入门

需求:编写一个user存储信息

<?xml version="1.0" encoding="utf-8"?>
<users>
	<user id="1">
		<name>zhangsan</name>
		<age>18</age>
	</user>
	
	<user id="2">
		<name>lisi</name>
		<age>18</age>
	</user>
</users>

书写规范

1. 页面必须有有文档声明(必须在第一行)
2. 有且仅有一个根标签
3. 标签要正确嵌套和正确的结束
4. 标签的属性必须使用引号(单双都可)

1.3 XML组成

  1. 文档声明
格式:
    		<?xml version="版本号" encoding="字符集"?>
    	属性:
    		version="1.0"  必须属性 指定xml文档的版本号 1.0(使用) or 1.1
    		encoding="utf-8" 可选属性,默认根据你开发环境
    	说明:
    		必须在xml文档第一行
  1. 标签(元素)
双标签:
	<开始></结束>
单标签:
	<开始/>
说明:
	标签命名规则与java变量是一致,建议不要使用 xml  或 XML
  1. 属性
属性的定义与html属性是一致
    		<user 属性="属性值" 属性='属性值'></user>
    	特殊:
    		id属性具有唯一性
  1. 文本
实体字符(转义字符)
    		&gt; 大于
    		&lt; 小于
    		&amp; &
    	
    	CDATA区:将数据原样展示输出  (了解)
    		CDATA= character + data
    		格式:
    			<![CDATA[需要展示的内容]]>
  1. 注释
<!-- 注释内容 -->

1.4 XML约束

1)概述

作用:规定xml文档的书写规则

学习要求

1. 能够在xml中引入约束文档
2. 能够简单的读懂约束文档 (IDE开发者工具,已经实现自动提示)

约束分类

1. DTD:一种简单的约束技术
	mybatis
2. Schema:一种复杂的约束技术
	spring

2)DTD约束

  • 当xml文档引入了DTD约束之后,它将xml文档从可扩展标记语言变成了预定义标记语言,也就是说限制了xml文档出现的标签和属性的等,以及标签和属性出现的次数和顺序等

DTD约束引入方式

1. 内部DTD约束
		<!DOCTYPE 根元素 [DTD约束内容]>
2. 外部DTD约束
	* 本地
			<!DOCTYPE 根元素 SYSTEM "DTD文件路径">
	* 互联网(推荐)
			<!DOCTYPE 根元素 PUBLIC "DTD文件名称" "DTD文件网络路径">

DTD约束语法

1. 标签(元素)
	* 嵌套标签
			格式:<!ELEMENT 标签名 (子标签..量词)
			量词:
				+	一次或多次
				*	零次或多次
				?	零次或一次
				,	按顺序出现
				|	选择其中一个
	* 普通标签
			格式:<!ELEMENT 标签名 标签类型>
			标签类型:
				(#PCDATA)	字符串
				EMPTY	单标签,例如:<hr/>
				ANY	任意类型
2. 属性
		格式:
			<!ATTLIST 标签名
				属性名 属性类型 属性说明
				属性名 属性类型 属性说明
				...
				>
		属性类型:
			ID 唯一,必须以字母开头
			CDATA 字符串
			ENUM 枚举,例如:职务(班长|学习委员|成员) '成员'
		属性说明:
			#REQUIRED 必须项
			#IMPLIED 可选项
			#FIXED 固定值,例如:学校 CDATA #FIXED '北京大学'




<?xml version="1.0" encoding="UTF-8" ?>
<!DOCTYPE students SYSTEM "student.dtd">
<students>
    <student number="heima_001" 职务="学习委员" 学校="北京大学">
        <name>张三</name>
        <age>18</age>
        <sex>男</sex>
    </student>

    <student number="heima_002">
        <name>李四</name>
        <age>20</age>
        <sex>男</sex>
    </student>
</students>



<!--
	将注释中的以下内容复制到要编写的xml的声明下面
	复制内容如下:
	<!DOCTYPE students SYSTEM "student.dtd">
 -->

<!--
    限定标签 ELEMENT
        1)嵌套标签
            格式:<!ELEMENT 标签名 (子标签 量词) >
            量词:
                + 一次或多次
                * 零次或多次
                ? 零次或一次
                , 按照顺序出现
                | 任选其一

        2)普通标签
            格式:<!ELEMENT 标签名 标签类型>
            标签类型:
                (#PCDATA) 字符串
                EMPTY 空标签(单标签)  <br/>
                ANY 表示任意标签

-->
<!ELEMENT students (student*) >
<!ELEMENT student (name,age,sex)>
<!ELEMENT name (#PCDATA)>
<!ELEMENT age (#PCDATA)>
<!ELEMENT sex (#PCDATA)>
<!--
    限定属性 ATTLIST attribute list
        格式:
            <!ATTLIST 标签名
                属性名 属性类型 属性说明
                属性名 属性类型 属性说明
                ... >
          属性类型:
                ID:唯一,要求属性值必须以字母开头
                CDATA: 字符串
                ENUM 枚举:
                    例如: 职务(班长|学习委员|成员) '成员'
          属性说明:
                #REQUIRED: 必选项
                #IMPLIED: 可选项
                # FIXED: 固定值
                    例如: 学校 CDATA #FIXED "北京大学"

-->
<!ATTLIST student
        number CDATA #IMPLIED
        职务(班长|学习委员|成员) "成员"
        学校 CDATA #FIXED "北京大学"
        >

3)Schema约束

  • Schema约束是一个特殊格式的xml文档,扩展名为*.xsd,xml文档可以引入多个schema约束,并且还可以限制元素内容的数据类型、数据范围 1-150

Schema约束引入方式

 <students xmlns="https://www.pku.edu.cn/xml"
 		   xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
 		   xsi:schemaLocation="https://www.pku.edu.cn/xml  student.xsd"
		   >	 
 </students>
 
 1. xmlns = xml namespace --》xml命名空间
 
 2. xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
 		固定值,声明当前文档是一个被Schema约束的一个实例
 3. xsi:schemaLocation="http://www.pku.edu.cn/xml  student.xsd"
 		通过实例,引入约束文件路径
 		格式:约束名 约束路径
 4. xmlns="https://www.pku.edu.cn/xml"
 		当前xml使用缺省(默认)的Schema约束,使用此约束中的元素直接写元素名即可
 		例如:<student></student>
 5. xmlns:aa="http://java.sun.com"
 		当前xml使用别名为 aa 的Schema约束,使用此约束中的元素需要加上别名
 		例如:<aa:student></aa:student>

二 XML解析

2.1 概述

操作xml文档,将文档中的数据读取到内存中

解析xml的方式

1. DOM:将xml文档内容一次性加载到内存,在内存中形成一颗DOM树
		优点:操作方便,可以对文档进行CRUD的所有操作
		缺点:占内存
2. SAX:逐行扫描文档,一边扫描一边解析
		优点:不占内存
		缺点:只能读取,不能增删改

常用xml解析器

技术 描述
JAXP SUN公司官方解析技术,支持DOM解析和SAX解析
PULL Android操作系统内置的解析器,sax方式的
JSOUP 是一款Java的HTML解析器(我们后面爬虫课程中讲解)
JDOM 开源的DOM方式解析技术
DOM4J JDOM增强版,也是开源的DOM方式解析技术(强烈推荐)

2.2 DOM4J解析XML

  • XML DOM 和 HTML DOM一样,XML DOM 将整个XML文档加载到内存,生成一个DOM树,并获得一个Document对象,通过Document对象就可以对DOM进行操作。

需求

通过dom4j技术来解析users.xml

如果解析的内容包含schema约束,比较麻烦

步骤分析

1. 导入jar包(今天的资料中)
		dom4j-1.6.1.jar
2. 将 users.xml 复制到 src根目录下

3. 定义一个类 ParseDemo
		// 1.手动加载配置文件,通过类加载器
		// 2.创建DOM4J解析器的核心对象 SAXReader()
		// 3.获取document文档对象

常用api方法

1. 提供获取xml文档根标签(元素)
		*Element getRootElement();
		
2. Element对象提供方法
	2.1 获取标签名的方法
		String getName();
	2.2 获取所有的子标签信息
		List<Element> elements();
	2.3 获取指定标签名的属性对象
		Attribute attribute(String 属性名);
	2.4 获取指定名称的子标签
		Element element(String 标签名);
	------------------------------------------------
	2.5 直接获取指定名称的属性值
		String attributeValue(String 属性名);
	2.6 直接获取指定名称子标签文本内容
		String elementText(String 标签名);



public static void main(String[] args) throws Exception {
    // 1. 手动加载配置文件
    // 1.1 获取类加载器对象
    ClassLoader classLoader = ParseDemo.class.getClassLoader();
    // 1.2 读取users.xml 获取该文件io流
    InputStream is = classLoader.getResourceAsStream("users.xml");
    // 2. 创建DOM4J核心解析器对象  simple  api   xml
    SAXReader saxReader = new SAXReader();
    // 2.1 加载 io流
    Document document = saxReader.read(is);

    // 3.1 获取文档的根标签(元素)
    Element rootElement = document.getRootElement();
    System.out.println(rootElement);

    // 3.2 获取根标签名  <users>
    String name = rootElement.getName();
    System.out.println(name);

    // 3.3 获取users下所有的子标签榆树
    List<Element> elements = rootElement.elements();
    System.out.println("users子标签长度:" + elements.size());

    // 3.4 获取第二个标签
    Element element = elements.get(1);

    // 3.5 获取 第二个标签 id属性对象
    Attribute idAttribute = element.attribute("id");
    System.out.println(idAttribute.getValue());

    // 3.6 获取name子标签
    Element nameElement = element.element("name");
    System.out.println(nameElement.getText());

    // -----------------------
    // 3.7 直接 user标签 edu属性值
    System.out.println(element.attributeValue("edu"));

    // 3.8 直接获取 user标签 子标签的 age文本内容
    System.out.println(element.elementText("age"));
}

2.2 DOM4J整合Xpath解析XML

  • 使用Xpath表达式可以快速查找文档中的标签

Xpath表达式

  • 今天资料中提供了xpath学习API文档

    • /aaa/bbb 绝对路径
    • //bbb 任意路径

    • //ccc[@id=“xxx”] 根据标签id属性快速查找
      document.getElementById("")

DOM4J提供了解析XPath表达式方法

1. 获取一个节点(元素)
		Node selectSingleNode(String xpath表达式);
2. 获取一组节点(元素)
		List<Node> selectNodes(String xpath表达式);

注意:还需要导入xpath依赖包 jaxen.jar

public static void main(String[] args) throws Exception {
    // 1. 手动加载配置文件
    // 1.1 获取类加载器对象
    ClassLoader classLoader = XpathDemo.class.getClassLoader();
    // 1.2 读取users.xml 获取该文件io流
    InputStream is = classLoader.getResourceAsStream("users.xml");
    // 2. 创建DOM4J核心解析器对象  simple  api   xml
    SAXReader saxReader = new SAXReader();
    // 2.1 加载 io流
    Document document = saxReader.read(is);

    // 3.1 通过xpath表达式 获取 指定id属性值的 唯一节点
    Node node = document.selectSingleNode("//f[@id='f_01']");
    // 将 node节点 强转为 element元素
    Element element = (Element) node;
    System.out.println(element.getText());

}

三 工厂模式

动态代理:对方法进行增强

设计模式:解决一些通用的固定问题的方式

3.1 概述

之前在程序中我们一直在使用实例化对象的方式(new 对象) Person p = new Person();如果我们在代码中实例化对象有一百行乃至成千上万行 ,那么想修改成实例化其他对象的时候,带来的工作量也就不言而喻了。

在实际企业开发中我们使用的配置文件+工厂模式代替new操作的一种设计模式。

配置文件:xml、properties

步骤分析

1. 定义domain实体包 创建一些类信息
2. 定义beans.xml 配置文件存放类信息
3. 定义demo1 获取指定名称 对象
4. 定义一个BeanFactory工厂类 生产对象
	    // 1.手动加载 users.xml 获取io流

        // 2.创建DOM4J核心解析器对象

        // 3.使用xpath表达式 获取指定id属性的 element对象

        // 4.获取标签体的 全限定名

        // 5.通过反射 将类加载到内存,并初始化 Class.forName("")

        // 6.创建对象实例 newInstance()

        // 7.返回对象实例

猜你喜欢

转载自blog.csdn.net/xc965746550/article/details/89577963