Java学习之XML

模拟servlet执行

浏览器的入口不同(访问路径),访问的资源也就不同,如下:

为了灵活的实现不同路径(/hello)执行不同的资源( HeIIoMyServlet)我们需要使用XML进行配置;

为了限定XML内容,我们需要使用xml约束(DTDschema);为了获得xml内容,我们需要使用dam4j进行解析

XML

XML称为Extensible Markup Language,意思是可扩展的标记语言XML语法上和HTML比较相似,但HTML中的元素是固定的,而XML的标签是可以由用户自定义的。

XML语法

XML文档声明

1.文档声明必须为<?xml开头,以?>结束;

2.文档声明必须从文档的0行0列位置开始:

3.文档声明只有属性:

  a) versioin:指定XML文档版本。必须属性,因为我们不会选择1.1,只会选择1.0;

  b) encoding:指定当前文档的编码。可选属性,默认值是。utf-8:

元素element

1.元素是XML文档中最重要的组成部分,

2.普通元素的结构开始标签、元素体、结束标签组成。例如:<hello>大家好</hello>

3.元素体:元素体可以是元素,也可以是文本,例如:<b><a>你好</a ></b>

4.空元素:空元素只有开始标签,而没有结束标签,但元素必须自己闭介,例如:<c/>

5.元素命名:

   a) 区分大小写

   b) 不能使用空格,不能使用冒号:

   c) 不建议以XML,  xml,  Xml开头

6.格式化良好的XML文档,必须只有一个根元素

属性

1.属性是元素的一部分,它必须出现在元素的开始标签中

2.属性的定义格式:属性名=属性值,其中属性值必须使用单引或双引

3.一个元素可以有0 ~ N个属性,但一个元素中不能出现同名属性

4.属性名不能使用空格、冒号等特殊字符,且必须以字母开头

注释

XML的注释与HTML相同,即以“<!--”开始,以“-->”结束。注释内容会被XML解析器忽略!

转义字符

XML中的转义字符与HTML一样。

因为很多符号己经被XML文档结构所使用,所以在元素体或属性值中想使用这些符号就必须使用转义字符,例如:"<"”>”、” ’ ”、” ” ”、”&”。

CDATA区

当大量的转义字符出现在xml文档中时,会使xml文档的可读性大幅度降低。这时如果使用CDATA段就会好一些。

CDATA段中出现的“<”、“>’,、“””、“‘”、“&”,都无需使用转义字符。这可以提高xml文档的可读性。

CDATA段中不能包含“]]>”,即CDATA段的结束定界符。

<?xml version="1.0" encoding="UTF-8"?>
<person>
	<student>
       <![CDATA[
            if(a<b&&b<c){
                sum=sum+a;
            }
       ]]>
	</student>
   <student>
      
   </student>
</person>

 DTD约束

DTD (Document Type Definition )文档类型定义,用来约束XML文档。规定XML文档中元素的名称,子元素的名称及顺序,元素的属性

开发中,通常情况我们都是通过框架提供的DTD约束文档,编写对应的XML文档。常见框架使用DTD约束:struts2,  hibernate等。

通过提供的DTD"web-app_2_3.dtd "编写XML

<?xml version="1.0" encoding="UTF-8"?>

<!--

模拟servlet2.3规范,如果开发人员需要在xml使用当前DTD约束,必须包括DOCTYPE

格式如下:

<!DOCTYPE web-app SYSTEM "web-app_2_3.dtd">

-->

<!ELEMENT web-app (servlet*,servlet-mapping* , welcome-file-list?) >

<!ELEMENT servlet (servlet-name,description?,(servlet-class|jsp-file))>

<!ELEMENT servlet-mapping (servlet-name,url-pattern+) >

<!ELEMENT servlet-name (#PCDATA)>

<!ELEMENT servlet-class (#PCDATA)>

<!ELEMENT url-pattern (#PCDATA)>

<!ELEMENT description (#PCDATA)>

<!ELEMENT jsp-file (#PCDATA)>

<!ELEMENT welcome-file-list (welcome-file+)>

<!ELEMENT welcome-file (#PCDATA)>

<!ATTLIST web-app version CDATA #IMPLIED>

案例实现步骤

1、创建web.xml文档,并将“web-app_ 2_ 3.dtd"拷贝相同目录下。

2、DTD文档开始处,拷贝需要的“文档声明”

3、完成XML内容的编写

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE web-app SYSTEM "web-app_2_3.dtd">
<web-app>
	<servlet>
		<servlet-name>MyServlet</servlet-name>
		<servlet-class>com.oracle.demo02.MyServlet</servlet-class>
	</servlet>

	<servlet-mapping>
		<servlet-name>MyServlet</servlet-name>
		<url-pattern>/myservlet</url-pattern>
	</servlet-mapping>

	<welcome-file-list>
		<welcome-file>index.jsp</welcome-file>
		<welcome-file>index.html</welcome-file>

	</welcome-file-list>
</web-app>

DTD语法

文档声明

内部DTD,在XML文档内部嵌入DTD,只对当前的XML有效

<?xml version="1.0" encoding="UTF-8"? standalone="yes" ?>

<!DOCTYPE web-app [

...//具体语法

]>

<web-app>

</web-app>

 外部DTD——本地DTDDTD文档在本地系统上,公司内部自己项目使用。

 

外部DTD——公共DTDDTD文档在网络上,一般都有框架提供

 

元素声明

定义元素语法:<!ELEMENT元素名 元素描述>

    元素名:自定义

    元素描述包括 : 符号和数据类型

          常见符号: ?  *  +  ()  |  ,

          常见类型:#PCDATA表示内容是文本,不能是子标签

符号

符号类型

描述

示例

?

问号

表示该对象可以出现,但只能出现一次

(菜鸟?

*

星号

表示该对象允许出现任意多次,也可以是零次

(爱好*)

+

加号

表示该对象最少出现一次,可以出现多次

(成员+)

()

括号

用来给元素分组

(古龙|金庸|梁羽生),

(王朔|余杰),毛毛

|

竖条

表明在列出的对象中选择一个

(男人|女人)

,

逗号

表示对象必须按指定的顺序出现

(西瓜,苹果,香蕉)

例如:

<!ELEMENT  web-app(servlet*servlet-mapping*welcome-file-list?)>

    web-app包括3个标签,且必须顺序出现。

        servlet子标签个数任意

        servlet-mapping子标签个数任意

        welcome-file-list子标签最多只能出现一次

<!ELEMENT servlet(servlet-namedescription?(servlet-class|jsp-file))>

    servlet3个子标签,且必须顺序出现

        servlet-name,必须有,且只能出现1

        description,可选1

        servlet-classjsp-file二选一,且只能出现一次

<!ELEMENT servlet-name(#PCDATA)>

    servlet-name的标签体必须是文本

<!ELEMENT  welcome-file-list  (welcome-file+)>

      welcome-file-list至少有1个子标签welcome-file

属性声明

 

Schema约束

 Schema是新的XML文档约束:

 Schema要比DTD强大很多,是DTD替代者;

 Schema本身也是XML文档,但Schema文档的扩展名为xsd,而不是xml .

 Schema功能更强大,数据类型更完善

 Schema支持名称空间

 DTD一样,要求可以通过schema约束文档编写xml文档。常见框架使用schema的有:Spring等通过提供”web-app_ 2_ 5.xsd"编写xml文档

<?xml version="1.0" encoding="UTF-8"?>

<!--

模拟servlet2.5规范,如果开发人员需要在xml使用当前Schema约束,必须包括指定命名空间。

格式如下:

<web-app xmlns="http://www.example.org/web-app_2_5"

xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"

xsi:schemaLocation="http://www.example.org/web-app_2_5 web-app_2_5.xsd"

version="2.5">

-->

<xsd:schema xmlns="http://www.w3.org/2001/XMLSchema"

targetNamespace="http://www.example.org/web-app_2_5"

xmlns:xsd="http://www.w3.org/2001/XMLSchema"

xmlns:tns="http://www.example.org/web-app_2_5"

elementFormDefault="qualified">

<xsd:element name="web-app">

<xsd:complexType>

<xsd:choice minOccurs="0" maxOccurs="unbounded">

<xsd:element name="servlet">

<xsd:complexType>

<xsd:sequence>

<xsd:element name="servlet-name"></xsd:element>

<xsd:element name="servlet-class"></xsd:element>

</xsd:sequence>

</xsd:complexType>

</xsd:element>

<xsd:element name="servlet-mapping">

<xsd:complexType>

<xsd:sequence>

<xsd:element name="servlet-name"></xsd:element>

<xsd:element name="url-pattern" maxOccurs="unbounded"></xsd:element>

</xsd:sequence>

</xsd:complexType>

</xsd:element>

<xsd:element name="welcome-file-list">

<xsd:complexType>

<xsd:sequence>

<xsd:element name="welcome-file" maxOccurs="unbounded"></xsd:element>

</xsd:sequence>

</xsd:complexType>

</xsd:element>

</xsd:choice>

<xsd:attribute name="version" type="double" use="optional"></xsd:attribute>

</xsd:complexType>

</xsd:element>

</xsd:schema>

 案例文档中同一个“命名空间”分别使用“默认命名空间”和“显示命名空间”进行引入,所以文档中<schema><xsd:schema>作用一样。

 

案例实现步骤

1、创建web.xml,并将"web-app_2_5.xsd"拷贝到同级目录

2、xsd文档中拷贝需要的“命名空间”   也就是对文档及进行声明

3、完成对XML内容的编写

<?xml version="1.0" encoding="UTF-8"?>

<web-app xmlns="http://www.example.org/web-app_2_5" 

xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"

xsi:schemaLocation="http://www.example.org/web-app_2_5 web-app_2_5.xsd"

version="2.5">

<servlet>

<servlet-name></servlet-name>

<servlet-class></servlet-class>

</servlet>

<servlet-mapping>

<servlet-name></servlet-name>

<url-pattern></url-pattern>

</servlet-mapping>

<welcome-file-list>

<welcome-file></welcome-file>

<welcome-file></welcome-file>

</welcome-file-list>

</web-app>

 命名空间

名称空间就是用来处理元素和属性的名称冲突问题,与Java中的包是同一用途。如果每个元素和属性都有自己的名称空间,那么就不会出现名字冲突问题,就像是每个类都有自己所在的包一样,那么类名就不会出现冲突。

约束文档和XML的关系

 W3C提出Schema约束规范时,就提供“官方约束文档”。我们通过官方文档,必须“自定义schema约束文档”,开发中“自定义文档”由框架编写者提供。我们根据“自定义文档”限定,写出自己的xml文档

声明命名空间

实例:web-a pp_2_5.xsd

实例:web.xml

dom4j解析

解析方式和解析器

1、DOM解析:要求解析器把整个XML文档装载到内存,并解析成一个Document对象。

     a) 优点:元素与元素之间保留结构关系,故可以进行增删改查操作。

   b)缺点:XML文档过大,可能出现内存溢出显现。

2、SAX:是一种速度更快,更有效的方法。它逐行扫描文档,一边扫描一边解析。并以事件 驱动的方式进行具体解析,每执行一行,都将触发对应的事件。(了解)

    a) 优点:处理速度快,可以处理大文件

    b) 缺点:只能读,逐行后将释放资源。

3、PULL:  Android内置的XML解析方式,类似SAX(了解)

解析器:就是根据不同的解析方式提供的具体实现。有的解析器操作过于繁琐,为了方便开发人员,有提供易于操作的解析开发包。

 常见的解析开发包:

1、 JAXP: sun公司提供支持DOMSAX开发包

2、JDom:dom4j兄弟

3、jsoup:一种处理HTML特定解析开发包

4、dom4j:比较常用的解析开发包,hibernate底层采用。

DOM解析原理以及结构模型

 XML DOMHTML DOM类似,XML DOM将整个XML文档加载到内存,生成一个DOM树,

 并获得一个Document对象,通过Document对象就可以对DOM进行操作

DOM中的核心概念就是节点,在XML文档中的元素、属性、文本等,在DOM中都是节点!

 API使用

如果需要使用dom4j,必须导入jar包。

 dom4j必须使用核心类SaxReader加载xml文档获得Document通过Document对象获得文档的根元素,然后就可以操作了。

步骤:

1.获取解析器

2.获得document文档对象

3.获取根元素

4.获取根元素下的子元素

5.遍历子元素

6.判断元素名称为servlet的元素

7.获取servlet-name元素

8.获取servlet-class元素

package com.oracle.demo04;

import java.util.List;

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;

public class Test {

	public static void main(String[] args) throws DocumentException {
		// 1.获取解析器
		SAXReader saxReader = new SAXReader();
		// 2.获得document文档对象
		Document doc = saxReader.read("src/com/oracle/demo04/web.xml");
		// 3.获取根元素
		Element rootElement = doc.getRootElement();
		// System.out.println(rootElement.getName());
		// 4.获取根元素下的子元素
		List<Element> arr = rootElement.elements();
		// 5.遍历子元素
		for (Element e : arr) {
			// System.out.println(e.getName());
			// 6.判断元素名称为servlet的元素
			if ("servlet".equals(e.getName())) {
				// 7.获取servlet-name元素
				Element servletname = e.element("servlet-name");
				String sn = servletname.getText();
				System.out.println(sn);
				// 8.获取servlet-class元素
				Element servletclass = e.element("servlet-class");
				String sc = servletclass.getText();
				System.out.println(sc);
			}
		}

	}

}
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE web-app SYSTEM "web-app_2_3.dtd">
<web-app>
	<servlet>
		<servlet-name>MyServlet</servlet-name>
		<servlet-class>com.oracle.demo02.MyServlet</servlet-class>
	</servlet>

	<servlet-mapping>
		<servlet-name>MyServlet</servlet-name>
		<url-pattern>/myservlet</url-pattern>
	</servlet-mapping>

	<welcome-file-list>
		<welcome-file>index.jsp</welcome-file>
		<welcome-file>index.html</welcome-file>

	</welcome-file-list>
</web-app>

通过反射解析XML文件中的内容,可以避免将代码写死

例如:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE web-app SYSTEM "web-app_2_3.dtd">
<web-app>
	<servlet>
		<servlet-name>MyServletImp</servlet-name>
		<servlet-class>com.oracle.demo05.MyServletImp</servlet-class>
	</servlet>
	<servlet-mapping>
		<servlet-name>MyServletImp</servlet-name>
		<url-pattern>/myservlet</url-pattern>
	</servlet-mapping>

</web-app>
package com.oracle.demo05;

public interface MyServlet {
   public void init();
   public void service();
   public void destory();
}

package com.oracle.demo05;

public class MyServletImp implements MyServlet {

	@Override
	public void init() {
		System.out.println("初始化");

	}

	@Override
	public void service() {
		System.out.println("服务");

	}

	@Override
	public void destory() {
		System.out.println("销毁");
	}

}

package com.oracle.demo05;

import java.lang.reflect.Method;
import org.dom4j.Document;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;

public class MyServletImpDemo {
	public static void main(String[] args) throws Exception {
		// 1.创建解析器对象
		SAXReader saxReader = new SAXReader();
		// 2.使用解析器加载web.xml文件得到document对象
		Document doc = saxReader.read("src/com/oracle/demo05/web.xml");
		// 3.获取根元素节点
		Element root = doc.getRootElement();
		// 4.根据元素名称获取子元素节点
		Element servletName = root.element("servlet");
		// 5.根据元素名称获取servlet-class的文本节点
		Element servletclass = servletName.element("servlet-class");
		String name = servletclass.getText();
		// 6.通过类全名获取字节码文件
		Class c = Class.forName(name);
		// 7.创建实例对象
		// MyServletImp m = (MyServletImp) c.newInstance();
		Object obj = c.newInstance();
		// 8.调用实例对象里面的方法
		// m.init();
		// m.service();
		// m.destory();
		Method init = c.getMethod("init");
		init.invoke(obj);
		Method service = c.getMethod("service");
		service.invoke(obj);
		Method destory = c.getMethod("destory");
		destory.invoke(obj);
	}
}

  

猜你喜欢

转载自www.cnblogs.com/Java-125/p/8986889.html