Javaweb学习笔记——（六）——————xml中jaxp两种解析方式和dom4j运用

1.xml的scheam约束
dtd的语法：<!ElEMENT 元素名称约束>
**schema符合xml的语法，xml语句
**一个xml中可以有多个schema，多个schema使用名称空间区分（类似于Java的包名）
**dtd里面有PADATA类型，但是在schema里面可以支持更多的数据类型
***比如年龄只能是整数，在schema可以直接定义一个整数类型

*** schema语法更加复杂，schema还不能替代dtd

2.schema的快速入门
*创建一个schema文件
**根节点：<schema>
*步骤
（1）看xml中有多少个元素
<element>

**在schema文件里面
**属性 xmlns="http://www.w3.org/2001/XMLSchema"
-表示当前xml文件是一个约束文件
targetNamespace="http://www.example.org/1"
-使用schema约束文件，直接通过这个地址引入约束文件
elementFormDefault="qualified"

步骤
（1）看xml中有多少个元素
<element>
（2）看简单元素和复杂元素
*如果复杂元素
<complexType>
<sequence>
子元素
</sequence>
</complexType>

（3）如果简单元素，写在复杂元素的
<element name="person">
<complexType>
<sequence>
<element name="name" type="string"></element>
<element name="age" type="int"></element>
</sequence>
</complexType>
</element>

（4）在被约束文件里面引入约束文件
<person xmlns:xsi="http://www.w3.org/2001/XMLSchema"
xmlns="http://www.example.org/1"
xsi:schemaLocation="http://www.example.org/1 1.xsd">

**xmlns：xsi="http://www.w3.org/2001/XMLSchema"
--表示xml是一个被约束文件

**xmlns="http://www.example.org/1"
--是约束文档里面 targetNamespace
**xsi:schemaLocation="http://www.example.org/1 1.xsd"
--targetNamespace 空格约束文档的地址路径

*<Sequance>：表示元素的出现的顺序
<all>：元素只能出现一次
<choice>：元素只能出现其中的一个
maxOccurs="unbounded"：表示元素的出现的次数
<any></any>：表示任意元素

*可以约束属性
*写在复杂元素里面
***写在 </complexType>之前
--
<attribute name="id1" type="int" use="required"></attribute>
-name：属性名称
-type：属性类型 int string
-use：属性是否必须出现required

*复杂的schema约束
<company xmlns = "http://www.w3.org/2001/XMLSchema"
xmlns:dept="http://www.example.org/department"
xmlns:xsi="http://www.w3.org/2001/XMLScema-instance"
xsi:schemaLocation="http://www.example.org/company company.xsd http://www.example.org/departent department.xsd"
>

*引入多个schema文件，可以给每个起一个别名

<employee age="30">
部门名称
<dept:name>100</dept:name>
*想要引入部门的约束文件里面的name，使用部门的别名 detp：元素名称
员工名称
<name>王晓晓</name>
</employee>

3.sax解析的原理
*解析xml有两种技术 dom和sax

*根据xml中的层级结构在内存中分配一个树形结构
**把xml中标签，树形，文本封装成对象

*sax方式：事件驱动，边读边解析
*在javax.xml.parsers包里面
** SAXParser
此类的实例可以从 SAXParserFactory.newSAXParser() 方法获得
-parse(File f, DefaultHandler dh)
*两个参数
**第一参数：xml的路径
*事件处理器
** SAXParserFactory
实例 newInstance() 方法得到
*画图分析一下sax执行过程
*当解析到开始标签的时候，自动执行startElement方法
*当解析到文本的时候，自动执行characters方法
*当解析到结束标签的时候，自动执行endElement方法

4.使用jaxp的sax方式解析xml
*sax方式不能实现增删改查操作，只能做查询操作
**打印出整个文档
***回写parse方法，第一个参数xml路径，第二个参数事件处理器
***创建一个类，继承事件处理器的类
***重写里面的三个方法

*获取到所有的name元素的值
**定义一个成员变量 flag = false
**判断开始方法是否是name元素，如果是name元素，把flag值设置为true
**如果flag值为true，才characters方法里面打印内容
**当执行到结束方法的时候吧flag值设置成false

*获取到第一个name元素的值
**定义一个成员变量 index = 1
**在结束方法时候，将 index++
**想要打印出第一个name元素的值，
-在characters方法里面判断
--判断flag=true 并且 index == 1，再打印内容

5.使用dom4j解析xml
*dom4j，是一个组织，针对xml解析，提供解析器 dom4j

*dom4j不是javase的一部分，想要使用第一步需要怎么做？
***导入dom4j提供jar包
--创建一个文件夹lib
--复制jar包到lib下面
--右击jar包，build path——add to buildpath
--看到jar包，变成奶瓶样子，表示导入成功

*得到document
SAXReader reader = new SAXReader();
Document document = reader.read(url);
*document的父接口是Node
*如果在document里面找不到想要的方法，到Node里面去找

*document里面的方法：getRootRlement()：获取根节点返回的是Element

*Element也是一个接口，父接口是Node
-Element和Node里面的方法
** getParent()：获取父节点
** addElement：添加标签

* elemnt(qname)
**表示获取标签下面的第一个子标签
**qname：标签的名称
* elements(qname)
**获取标签下面是这个名称的所有的子标签(一层)
**qname：标签名称
*elements()
**获取标签下面的所有的一层子标签

6.使用dom4j查询xml
*解析是从上到下来解析的
*查询所有name元素里面的值
/*
1.创建解析器
2.得到document
3.得到根节点 getRootElenment() 返回Element
4.得到所有的p1标签
*element("p1") 返回list集合
*遍历list得到每一个p1
5.得到name
*在p1下面执行 element("name")方法返回Element
6.得到name里面的值
*getText()得到里面的值
*/

*查询第一个name元素的值
/*
* 1.创建解析器
* 2.得到document
* 3.得到根节点
*
* 4.得到第一个p1元素
**element("p1")方法返回Element
* 5.得到p1下面的name
**element("name")方法返回Element
* 6.得到name里面的值
**getText()方法
*/

*获取第二个name元素的值
/*
* 1.创建解析器
* 2.得到document
* 3.得到根节点
*
* 4.得到第二个p1
**返回list集合
* 5.得到p1下面的name
**使用list下标得到get方法，集合的下标从0开始，想要得到第二个值，下标写1
* 6.得到name里面的值
**getText方法
*/

7.使用dom4j实现添加操作
*在第一个p1标签末尾添加一个元素 <sex>nan</sex>
*步骤：
/*
* 1.创建解析器
* 2.得到document
* 3.得到根节点
*
* 4.获取到第一个p1
*使用element方法
* 5.在p1下面添加元素
*在p1上面直接使用addElement("标签名称")方法返回一个Element
* 6.在添加完成之后的元素下面添加文本
在sex上直接使用 setText("文本内容");方法
*
* 7.回写xml
*格式化 OutputFormat，使用 createPrettyPrint方法，表示一个漂亮的格式
*使用类XMLWriter 直接new这个类，传递这个两个参数
***第一个参数是xml文件路径 new FileOutputStream("路径");
***第二个参数是格式化类的值
*/
8.使用dom4j在特定的位置添加一个元素
*在第一个p1下面的age标签之前添加一个 <school>JJU</school>
*步骤
/*
* 1.创建解析器
* 2.得到document
* 3.得到根节点
*
* 4.获得到第一个p1
*
* 5.获取p1下面的所有的元素
* **elements()方法返回 list集合
* **使用list里面的方法，在list里面添加元素
* **创建元素，在元素下面创建文本
-使用createElement(QName qname);创建标签
-把文本添加到标签下面，使用 setText("文本内容")方法

* ***add(int index, E element)
* -第一个参数是位置下标，从0开始
* -第二个参数是要添加的元素
*
* 6.回写xml
*/

**可以对得到document的操作和回写xml的操作，封装成方法
**也可以吧传递的文件路径，封装成一个常量
***好处：可以提高开发速度，可以提高代码的可维护性
-比如想要修改文件路径（名称），这个时候只需要修改常量的值就可以了，其他代码不需要改变

9.使用dom4j实现修改节点的操作
*修改第一个p1下面的age元素的值 <age>30</age>
*步骤
/*
* 1.得到document
* 2.得到根节点，然后第一个p1元素.
* 3.得到p1下面的age
element("")方法
* 4.修改值是30
*使用setText("文本内容")方法
*
* 5.回写xml
*/

10.使用dom4j来实现删除节点的操作
*删除第一个p1下面的<school>JJU</school>元素
*步骤
/*
* 1.得到document
* 2.得到根节点
* 3.得到第一个p1标签
* 4.得到第一个p1下面的school元素
* 5.删除（使用p1删除school）
*得到school的父节点
-第一种直接得到p1
-使用方法 getParent方法得到
*删除操作
-在p1上面执行remove方法删除节点
*
* 6.回写xml
*/

11.使用dom4j获取属性的需求
*获取第一个p1里面的属性id的值
*步骤
/*
* 1.得到document
* 2.得到根节点
* 3.得到第一个p1元素
* 4.得到p1里面的属性值
-p1.attributeValue("id");
-在p1上面执行这个方法，里面的参数是属性名称
*/

12.使用dom4j支持xpath的操作
*可以直接获取到某个元素

*第一种形式
/AAA/DDD/BBB：表示一层一层的，AAA下面的 DDD下面的BBB
*第二种形式
//BBB：表示和这个名称相同，表示只要名称是BBB，都得到
*第三种形式
/*：所有元素
*第四种形式
** BBB[1]：表示第一个BBB元素
** BBB[last()]：表示最后一个BBB元素
*第五种形式
** //BBB[@id]：表示只要BBB元素上面有id属性，都得到
*第六种形式
** //BBB[@id='b1']：表示元素名称是BBB，在BBB上面有id属性，并且id的属性值是b1

13.使用dom4j支持xpath具体操作
**默认的情况下，dom4j不支持xpath
**如果想要在dom4j里面是有xpath
*第一步需要，引入支持xpath的jar包，使用jaxen-xxxx.jar
**需要把jar包导入到项目中
**在dom4j里面提供了两个方法，用来支持xpath
*** selectNodes("xpath的表达式")
-获取多个节点
***selectSingleNode("xpath表达式")
-获取一个节点

**使用xpath实现：查询xml中所有的name元素的值
**所有name元素的xpath表示： //name
**使用selectNodes("//name");
**代码和步骤
public static void test1(){
/*
* 1.得到document
* 2.直接使用selectNodes("//name")方法的到所有的name元素
*
*/

//得到document
Document document = Dom4jUtils.getDocument(Dom4jUtils.PATH);

//直接使用selectNodes("//name")方法的到所有的name元素
List<Node> list = document.selectNodes("//name");

//遍历list集合
for(Node node : list){
//node是每一个name元素
//得到name元素里面的值
String name = node.getText();

System.out.println(name);

}
}

**使用xpath实现：获取第一个p1下面的name的值
* //p1[@id='aaa']/name
*使用到selectSingleNode("//p1[@id='aaa']/name")
*步骤和代码
public static void test2() {
/*
* 1.得到document
* 2.直接使用selectSingleNode方法实现
* - xpath：//p1[@id='aaa']/name
*/

//得到document
Document document = Dom4jUtils.getDocument(Dom4jUtils.PATH);

//直接使用selectSingleNode方法实现
Node name = document.selectSingleNode("//p1[@id='aaa']/name");

//获取name元素下面的值
String nameStr = name.getText();

System.out.println(nameStr);

}

14.实现简单的学生管理系统
**使用xml当做一个数据库，存储学生信息

**创建一个xml文件，写一些学生信息

**增加操作
//增加
public static void addStu(Student student){
/*
* 1.创建解析器
* 2.得到document
* 3.得到根节点
* 4.在根节点上面添加stu标签
* 5.在stu标签上面依次添加id，name，age
* 6.在id，name，age上面依次添加值
** setText()操作
*
* 7.回写xml
*/

//直接通过工具类获取document
Document document = Dom4jUtils.getDocument(Dom4jUtils.PATH);

//得到根节点
Element root = document.getRootElement();

//在根节点上添加stu
Element stu = root.addElement("stu");

//在根节点上添加id，name，age标签
Element id = stu.addElement("id");
Element name = stu.addElement("name");
Element age = stu.addElement("age");

//在各个属性标签上添加对应的值
id.setText(student.getId());
name.setText(student.getName());
age.setText(student.getAge());

//回写xml
Dom4jUtils.xmlWriters(Dom4jUtils.PATH, document);

//提示消息
System.out.println("成功添加"+student.toString()+"的信息");

}

**删除操作（根据id删除）
//删除
public static void delStu(String id){
/*
* 1.通过Dom4jUtil工具类直接获取document
* 2.得到根节点
*
* 3.获取到所有的id
* 使用xpath //id 返回list集合
* 4.遍历list集合
* 5.判断集合里面的id和传递的id是否相同
* 6.如果相同，就把id所在的stu删除(删除父节点，同时该结点下的结点都会被删除)
*
* 7.回写xml
*/

//获取document
Document document = Dom4jUtils.getDocument(Dom4jUtils.PATH);

//获取所有的id
List<Node> list = document.selectNodes("//id");

//遍历list集合
for(Node id2 : list){
//判断id的值是否和方法中传过来的id相同
if (id2.getText().equals(id)) {//相同
//获取id2的父节点 stu
Element stu = id2.getParent();
//获取stu的父节点
Element student = stu.getParent();

//删除stu
student.remove(stu);
}
}

//回写xml
Dom4jUtils.xmlWriters(Dom4jUtils.PATH, document);

System.out.println("成功删除 "+id+" 学生的信息。");
}

**查询操作
//查询
//根据id来查询学生信息
public static Student selectStu(String id) {
/*
* 1.根据Dom4jUtil工具直接获取document
* 2.获取到所有的id标签
* 3.返回的list集合，遍历集合
* 4.得到每一个id节点，
* 5.获取每一个id节点的值
* 6.判断id的值，和传递过来的id值是否相同
* 7.如果相同，则获得id的父节点stu
* 8.获得stu中的name，age节点中的值

**把这些值封装到一个对象中，返回对象
*/

//获取document
Document document = Dom4jUtils.getDocument(Dom4jUtils.PATH);

//获取到所有的id标签
List<Node> list = document.selectNodes("//id");

//定义nameStr，ageStr
String nameStr = "";
String ageStr = "";

//遍历
for(Node id2 : list){
//获得id节点上的值
String idStr = id2.getText();
if (idStr.equals(id)) {//相同
//获取该节点的父节点stu
Element stu = id2.getParent();

//获取结点stu的name节点上的nameStr
nameStr = stu.element("name").getText();

//获取结点stu的age节点上的ageStr
ageStr = stu.element("age").getText();

System.out.println("查询到一个学生信息：");
}
}

Student student = new Student(id, nameStr, ageStr);

return student;
}

Javaweb学习笔记——（六）——————xml中jaxp两种解析方式和dom4j运用

猜你喜欢