XML简介及基本语法

一、xml的简介(了解)

* Extensible Markup Language:可扩展标记型语言
** 标记型语言:html是标记型语言
- 也是使用标签来操作
** 可扩展:
- html里面的标签是固定,每个标签都有特定的含义 <h1> <br/> <hr/>
- xml标签可以自己定义,可以写中文的标签 <person></person>、<猫></猫>

* xml用途
** html是用于显示数据,xml也可以显示数据(不是主要功能)
** xml主要功能,为了存储数据

* xml是w3c组织发布的技术

* xml有两个版本 1.0  1.1

- 使用都是1.0版本,(1.1版本不能向下兼容)

二、xml的应用

* 不同的系统之间传输数据
** qq之间数据的传输
        有利于程序的后期维护

* 用来表示生活中有关系的数据

* 经常用在文件配置
* 比如现在连接数据库 肯定要知道数据库的用户名和密码,数据库名称 

* 如果修改数据库的信息,不需要修改源代码,只要修改配置文件就可以了

三、xml的语法

        1.文档声明

                * 创建一个文件 后缀名是 .xml
* 如果写xml,第一步 必须要有 一个文档声明(写了文档声明之后,表示写xml文件的内容)
** <?xml version="1.0" encoding="gbk"?>
*** 文档声明必须写在 第一行第一列

* 属性
- version:xml的版本 1.0(使用) 1.1
- encoding:xml编码 gbk  utf-8  iso8859-1(不包含中文)
- standalone:是否需要依赖其他文件 yes/no

* xml的中文乱码问题
** 保存时候的编码和设置打开时候的编码一致,就不会出现乱码

        2.元素(标签)定义

        ** 标签定义有开始必须要有结束:<person></person>
        ** 标签没有内容,可以在标签内结束:<aa/>
        ** 标签可以嵌套,必须要合理嵌套
*** 合理嵌套 <aa><bb></bb></aa>
*** 不合理嵌套 <aa><bb></aa></bb>: 这种方式是不正确的
        ** 一个xml中,只能有一个根标签,其他标签都是这个标签下面的标签

        ** 在xml中把空格和换行都当成内容来解析
        **** 下面这两段代码含义是不一样的
                * <aa>1111111</aa>
                * <aa>
                    11111111111
                 </aa>

        ** xml标签可以是中文

        ** xml中标签的命名规则
        (1)xml代码区分大小写
        <p> <P>:这两个标签是不一样的
        (2)xml的标签不能以数字和下划线(_)开头
        <2a> <_aa>: 这样是不正确的
        (3)xml的标签不能以xml、XML、Xml等开头
        <xmla> <XmlB> <XMLC>: 这些都是不正确的
        (4)xml的标签不能包含空格和冒号
        <a b> <b:c> : 这些是不正确的

        3.属性定义

        * html是标记型文档,可以有属性
        * xml也是标记型文档,可以有属性

        * <person id1="aaa" id2="bbb"></person>

        ** 属性定义的要求
        (1)一个标签上可以有多个属性
        <person id1="aaa" id2="bbb"></person>
        (2)属性名称不能相同
        <person id1="aaa" id1="bbb"></person>:这个是不正确,不能有两个id1

        (3)属性名称和属性值之间使用= ,属性值使用引号 (可以是单引号,也可以是双引号 )

                        (4)xml属性的名称规范和元素的名称规范一致

        4.注释

        * 格式:

                                <!-- xml的注释 --> 

        ** 注意的地方
        **** 注释不能嵌套
        <!--  <!-- -->  -->
        <!-- <!-- <sex>nv</sex>--> -->

        ** 注释也不能放到第一行,第一行第一列必须放文档声明

        5.特殊字符

        * 如果想要在xml中现在 a<b ,不能正常显示,因为把<当做标签
        * 如果就想要显示,需要对特殊字符 < 进行转义
        ** <    &lt;

           >    &gt;

        6.CDATA区(了解)

        * 可以解决多个字符都需要转义的操作 if(a<b && b<c && d>f) {}
        * 把这些内容放到CDATA区里面,不需要转义了
        ** 写法
        <![CDATA[ 内容  ]]>
        - 代码
        <![CDATA[ <b>if(a<b && b<c && d>f) {}</b> ]]>

        ** 把特殊字符,当做文本内容,而不是标签

        7.PI指令(处理指令)(了解)

        * 可以在xml中设置样式
        * 写法: <?xml-stylesheet type="text/css" href="css的路径"?>

        * 设置样式,只能对英文标签名称起作用,对中文的标签名称不起作用。

<?xml version="1.0" encoding="GBK"?>
<?xml-stylesheet type="text/css" href="a.css"?>
<person>
	<name>张三</name>
	<age>22</age>
	<aaa>1&lt;2</aaa>
	<![CDATA[<p>www.badu.com</p>]]>
</person>
        ** xml的语法的总结
所有 XML 元素都须有关闭标签
XML 标签对大小写敏感
XML 必须正确地嵌套顺序
XML 文档必须有根元素(只有一个)
XML 的属性值须加引号
特殊字符必须转义 --- CDATA

XML 中的空格、回车换行会解析时被保留

四、xml的约束

        * 为什么需要约束?
        ** 比如现在定义一个person的xml文件,只想要这个文件里面保存人的信息,比如name age等,但是如果在xml文件中
            写了一个标签<猫>,发现可以正常显示,因为符合语法规范。但是猫肯定不是人的信息,xml的标签是自定义的,需要技术来
            规定xml中只能出现的元素,这个时候需要约束。

        * xml的约束的技术 : dtd约束 和 schema约束 (看懂)

五、dtd的快速入门

* 创建一个文件 后缀名 .dtd

步骤:
(1)看xml中有多少个元素 ,有几个元素,在dtd文件中写几个 <!ELEMENT>
(2)判断元素是简单元素还是复杂元素
- 复杂元素:有子元素的元素
<!ELEMENT 元素名称 (子元素)>
- 简单元素:没有子元素
<!ELEMENT 元素名称 (#PCDATA)>
(3)需要在xml文件中引入dtd文件
<!DOCTYPE 根元素名称 SYSTEM "dtd文件的路径">

** 打开xml文件使用浏览器打开的,浏览器只负责校验xml的语法,不负责校验约束

** 如果想要校验xml的约束,需要使用工具(myeclipse工具)

** 打开myeclipse开发工具
*** 创建一个项目
*** 在项目的src目录下面创建一个xml文件和一个dtd文件
*** 当xml中引入dtd文件之后,xml中写到了约束外的标签,会提示出错
xml文档演示:
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE person SYSTEM "1.dtd">
<person>
	<student>
		<name>张三</name>
		<age>18</age>
	</student>
	<student>
		<name>李四</name>
		<age>20</age>
	</student>
</person>

该xml的dtd约束文档:

<!ELEMENT person (student+)>
<!ELEMENT student (name,age)>
<!ELEMENT name (#PCDATA)>
<!ELEMENT age (#PCDATA)>

六、dtd的三种引入方式

         1.引入外部的dtd文件
<!DOCTYPE 根元素名称 SYSTEM "dtd路径">
2.使用内部的dtd文件
<!DOCTYPE 根元素名称 [
<!ELEMENT person (name,age)>
<!ELEMENT name (#PCDATA)>
<!ELEMENT age (#PCDATA)>
]>
3.使用外部的dtd文件(网络上的dtd文件)
<!DOCTYPE 根元素 PUBLIC "DTD名称" "DTD文档的URL">
- 后面学到框架 struts2 使用配置文件 使用 外部的dtd文件
- <!DOCTYPE struts PUBLIC   "-//Apache Software Foundation//DTD Struts Configuration 2.0//EN"    
  "http://struts.apache.org/dtds/struts-2.0.dtd">

七、使用dtd定义元素

* 语法: <!ELEMENT 元素名 约束>

* 简单元素:没有子元素的元素
<!ELEMENT name (#PCDATA)>
*** (#PCDATA): 约束name是字符串类型
*** EMPTY : 元素为空(没有内容)
- <sex></sex>
*** ANY:任意
* 复杂元素:
<!ELEMENT person (name,age,sex,school)>
- 子元素只能出现一次
* <!ELEMENT 元素名称 (子元素)>

* 表示子元素出现的次数
+ : 表示一次或者多次
? :表示零次或者一次
* :表示零次或者多次

* 子元素直接使用 逗号,进行隔开
** 表示元素出现的顺序

* 子元素直接使用 |隔开
** 表示元素只能出现其中的任意一个
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE books[
	<!ELEMENT books (book+)>
	<!ELEMENT book (name,writer,time,price)>
	<!ELEMENT name (#PCDATA)>
	<!ELEMENT writer (#PCDATA)>
	<!ELEMENT time (#PCDATA)>
	<!ELEMENT price EMPTY>
]>
<books>
	<book>
		<name>三体</name>
		<writer>刘慈欣</writer>
		<time>2008.1</time>
		<price></price>
	</book>
	<book>
		<name>平凡的世界</name>
		<writer>路遥</writer>
		<time>1986.12</time>
		<price></price>
	</book>
</books>

八、使用dtd定义属性

* 语法    <!ATTLIST 元素名称
属性名称 属性类型 属性的约束
    >

* 属性类型
- CDATA: 字符串
- <!ATTLIST birthday
ID1 CDATA #REQUIRED
>

- 枚举 : 表示只能在一定的范围内出现值,但是只能每次出现其中的一个
** 红绿灯效果
** (aa|bb|cc)
- <!ATTLIST age
ID2 (AA|BB|CC)  #REQUIRED
>

- ID: 值只能是字母或者下划线开头
- <!ATTLIST name 
ID3 ID   #REQUIRED
>

* 属性的约束
- #REQUIRED:属性必须存在

- #IMPLIED:属性可有可无

- #FIXED: 表示一个固定值 #FIXED "AAA"
- 属性的值必须是设置的这个固定值
- <!ATTLIST sex
ID4 CDATA #FIXED "ABC"
>
- 直接值
* 不写属性,使用直接值
* 写了属性,使用设置那个值
- <!ATTLIST school
ID5 CDATA "WWW"

>

九、实体的定义

* 语法 <!ENTITY 实体名称 "实体的值">

                    使用实体: &实体名称; 

*** <!ENTITY TEST "新华社">
***  引用 : &TEST;

*注意
* 定义实体需要写在内部dtd里面,

 如果写在外部的dtd里面,有某些浏览器下,内容得不到

w3cschool实例代码演示:    (能看懂就行)

<!ELEMENT TVSCHEDULE (CHANNEL+)>
<!ELEMENT CHANNEL (BANNER,DAY+)>
<!ELEMENT BANNER (#PCDATA)>
<!ELEMENT DAY (DATE,(HOLIDAY|PROGRAMSLOT+)+)>
<!ELEMENT HOLIDAY (#PCDATA)>
<!ELEMENT DATE (#PCDATA)>
<!ELEMENT PROGRAMSLOT (TIME,TITLE,DESCRIPTION?)>
<!ELEMENT TIME (#PCDATA)>
<!ELEMENT TITLE (#PCDATA)> 
<!ELEMENT DESCRIPTION (#PCDATA)>

<!ATTLIST TVSCHEDULE NAME CDATA #REQUIRED>
<!ATTLIST CHANNEL CHAN CDATA #REQUIRED>
<!ATTLIST PROGRAMSLOT VTR CDATA #IMPLIED>
<!ATTLIST TITLE RATING CDATA #IMPLIED>
<!ATTLIST TITLE LANGUAGE CDATA #IMPLIED>
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE TVSCHEDULE SYSTEM "cctv.dtd">
<TVSCHEDULE NAME="CCTV">
	<CHANNEL CHAN="5">
		<BANNER></BANNER>
		<DAY>
			<DATE></DATE>
			<HOLIDAY></HOLIDAY>
		</DAY>
	</CHANNEL>
	<CHANNEL CHAN="6">
		<BANNER></BANNER>
		<DAY>
			<DATE></DATE>
			<PROGRAMSLOT VTR="xxx">
				<TIME></TIME>
				<TITLE></TITLE>
			</PROGRAMSLOT>
		</DAY>
	</CHANNEL>
</TVSCHEDULE>

猜你喜欢

转载自blog.csdn.net/fy_java1995/article/details/80039746