1. XML
1.1 XML Overview
Extensible Markup Language
可拓展标记语言
用途:
1. 数据存储,小型数据库,存在一定的CRUD操作可行性
2. 网络端数据的传输
3. JavaWEB框架项目配置文件
Spring Druid ....
1.2 The basic syntax
1. XML文件后缀名是.xml
2. XML第一行是对于当前文件的定义声明
3. XML文件中有且只有一个根标签
4. 属性值必须使用引号包含,这里推荐使用双引号
5. 标签必须正确匹配,正确开始和关闭
6. XML标签内严格区分大小写
1.3 XML file part
1. 文档声明:
a. 格式:
<?xml 属性列表 ?>
<?xml version="1.0" encoding="utf-8" ?>
version: 当前XML文件版本号
encoding: 编码方式,这里建议XML文件的保存编码集和对应的解析编辑一致。
standalone:是否依赖于其他文件 [了解]
yes 不依赖, no 依赖
2. 指令(了解)
这里可以导入一些CSS样式
<?xml-stylesheet type="text/css" href="test.css" ?>
3. 标签内容自定义
规则:
a. 自定义标签允许使用英文字母,数字和其他标点符号(_ - .)
b. 不允许使用数组和标点符号开头,只能用英文字母
c. 不允许在自定义标签内使用xml标记,XML也不行
d. 名字不允许出现空格
4. 属性
可以给标签一个属性,有时候要求ID属性是惟一的
5. 文本(了解)
CDATA区,所见即所得,CDATA区内容是完整展示的
格式:
<![CDATA[ 数据 ]]>
1.4 XML file data constraints
1. DTD
一种简单的约束方式
但是存在一定的约束问题
2. Schema
一种复杂XML文件约束方式
非常严谨
1.4.1 DTD constraints
<!-- students 根标签 要求根标签内存放student -->
<!ELEMENT students (student*) >
<!-- student标签包含子标签的内容 -->
<!ELEMENT student (name,age,sex)>
<!-- 所有子标签当前数据都都是文本形式 -->
<!ELEMENT name (#PCDATA)>
<!ELEMENT age (#PCDATA)>
<!ELEMENT sex (#PCDATA)>
<!-- ATTLIST Attribute List 属性列表 student id ID -->
<!ATTLIST student id ID #REQUIRED>
1.4.2 Schema Constraint
<?xml version="1.0"?>
<xsd:schema xmlns="http://www.qfedu.com/xml"
xmlns:xsd="http://www.w3.org/2001/XMLSchema"
targetNamespace="http://www.qfedu.com/xml" elementFormDefault="qualified">
<!-- 根节点名字和包含的内容,内容是自定义studentType -->
<xsd:element name="students" type="studentsType"/>
<!-- studentType类型声明 -->
<xsd:complexType name="studentsType">
<xsd:sequence>
<!-- students根节点中存放的是student类型 type="studentType" 要求student的个数从0开始 个数不限制 -->
<xsd:element name="student" type="studentType" minOccurs="0" maxOccurs="unbounded"/>
</xsd:sequence>
</xsd:complexType>
<!-- studentType声明 -->
<xsd:complexType name="studentType">
<xsd:sequence>
<!-- 要求student标签内有name,age,sex子标签,并且要求对一个对应保存的数据类型是type指定 -->
<xsd:element name="name" type="xsd:string"/>
<!-- ageType 和 sexType 是自定义数据约束 -->
<xsd:element name="age" type="ageType" />
<xsd:element name="sex" type="sexType" />
</xsd:sequence>
<!-- 给予Student标签属性 属性为id,要声明idType, use="required"不可缺少的 -->
<xsd:attribute name="id" type="idType" use="required"/>
</xsd:complexType>
<!-- sexType性别类型声明 -->
<xsd:simpleType name="sexType">
<xsd:restriction base="xsd:string">
<!-- 有且只有两个数据 male female -->
<xsd:enumeration value="male"/>
<xsd:enumeration value="female"/>
</xsd:restriction>
</xsd:simpleType>
<xsd:simpleType name="ageType">
<xsd:restriction base="xsd:integer">
<!-- 0 ~ 256 要求范围,是一个integer类型 -->
<xsd:minInclusive value="0"/>
<xsd:maxInclusive value="256"/>
</xsd:restriction>
</xsd:simpleType>
<xsd:simpleType name="idType">
<xsd:restriction base="xsd:string">
<!-- ID类型,要求gp_xxxx(四位数字) -->
<xsd:pattern value="gp_\d{4}"/>
</xsd:restriction>
</xsd:simpleType>
</xsd:schema>
2. XML parsing
2.1 XML parsing ideas
DOM解析
Document Object Model 文件对象模型
把XML整个文件看做一个Document对象,每一个节点看做一个Element,节点中有Attribute,或者当前节点中存在Text文本内容。
DOM是将整个XML文件读取到计算机内存中,可以进行CRUD操作。
缺点:
占用了大量内存空间
适用的环境:
服务器对于XML文件的解析过程。
SAX解析
逐行读取,给予一定的事件操作。
读取一行内容,释放上一行内容,可以有效的节约内存空间
缺点:
不能对XML文件,进行增删改
适用的环境:
手机读取解析XML文件时采用的方式。
2.2 XML file parsing tools
1. JAXP: SUN提供的一个基本的解析器,支持DOM和SAX两种解析方式,但是操作很繁琐,不便于程序员开发。
2. Dom4j: DOM For Java 一款非常优秀的解析器
Spring,SpringMVC... 框架中集成的XML解析器
3. Jsoup: 基于Java完成的对于HTML解析的工具,因为HTML和XML文件都是标记语言。
给Jsoup一个URL,页面地址. Java的小爬虫,API很多很方便
4. PULL:
Android手机上集成的XML解析工具,SAX方式解析