XML 相关规则

XML(EXtensible Markup Language,可扩展标记语言)

1)、特点
XML被设计用来传输和存储数据,HTML被设计用来显示数据;
XML的标签未被预定义,需自行定义;
XML被设计为具有自我描述性,是W3C的推荐标准(98.02.10)
XML独立于硬件、软件以及应用程序

2)用途
①把数据从HTML中分离
②简化数据分享(以纯文本格式进行存储)
③简化数据传输(在不兼容的系统间轻松的交换数据)
④简化平台的变更
⑤用于创建新的Internet语言

XML基本组成

1)、树结构
①XML声明,定义XML的版本和所使用的编码
如:<?xml version=“1.0” encoding=“ISO-8859-1”?>
②根元素
如:(表明本文档是一个标签)
③子元素
④根元素结尾

2)、特点
①XML文档必须包含根元素,是其他元素的父元素
②所有元素均可拥有文本内容和属性
③所有XML元素都须有关闭标签(与打开标签相对应)
④XML标签对大小写敏感
⑤XML标签需进行逐层嵌套
⑥XML的属性值须加引号
⑦XML中的空格会被保留

3)、实体引用(类似于转义)
在XML中,’<‘和’&‘是非法的
&lt;(<,小于) &gt;(>,大于)
&amp;(&,和号) &apos;(’,单引号)
&quot;(",双引号)

4)、注释
<!-- 注释内容–>

5)、关于换行符(回车(CR)、换行(LF))
Windows(CRLF)、Unix(LF)、Macintosh(CR)、XML(LF)

XML元素

1)、特征
①XML元素是从开始标签到结束标签的部分(包含标签)
②XML元素可包含其他元素、文本或两者混合物,也可拥有属性
③XML元素是可扩展的(添加元素后,并不影响之前程序对元素的提取)

2)、命名规则
①可含字母、数字及其他字符
②不能以数字或标点符号开始
③不能以字符XML、xml、Xml开始
④不可包含空格
PS:命名习惯:
具有描述性、简短
避免"-"(某些软件认为提取第一个单词)
避免"."(某些软件会认为后面部分为前面的属性)
避免":"(冒号会被转换为命名空间来使用)
XML文档经常有一个对应的数据库,可使用数据库的命名规则来命名元素

XML属性

1)、职责
属性(Attribute)提供元素的额外信息
属性通常提供不属于数据组成部分的信息,但很重要(如:图片格式)

2)、使用方法
必须加引号:单引和双引均可
Tips:如果属性值本身包含双引号,可以用单引号包围,也可以实体引用

扫描二维码关注公众号,回复: 10300787 查看本文章

3)、属性引起的一些问题
①无法包含多重的值(元素可以包含子元素)
②无法描述树结构
③不易扩展
④难以阅读和维护
PS:仅仅使用属性来提供与数据无关的信息
若信息像数据,尽量使用子元素,避免使用数据

4)、元数据
元数据是标识不同的便签,与便签的数据内容无关,应当存储为属性

XML验证

1)、DTD
2)、XML Schema
XML文档中的错误会终止XML程序

命名空间

1)、提供避免元素命名冲突
当两个不同的文档使用相同的元素名时,可使用前缀来解决冲突
xmlns为命名空间属性,被放置于元素的开始标签中
所有带有相同前缀的子元素都与同一个命名空间相关联
PS:用于标识命名空间的地址不会被解析器用于查找信息,
它的职责是赋予命名空间一个唯一的名称。

2)、默认命名空间
使用xmlns时不使用别名即为默认命名空间

CDATA区段

所有的xml文档均会被解析器解析,
只有CDATA区段中的文本会被解析器忽略
1)、PCDATA (Parsed Character Data)
PCDATA 指的是被解析的字符数据。
XML 解析器通常会解析 XML 文档中所有的文本。

2)、CDATA (Unparsed Character Data)
不应由XML解析器进行解析的文本数据。
对于包含大量"<“和”&“的文本,避免错误及复杂的实体引用替换,可将其定义为CDATA
开始标记:”<![CDATA[" 结束标记:"]]>"
PS:不能包含字符串"]]>",也不允许嵌套的CDATA部分
"]]>"不能包含空格或折行

发布了82 篇原创文章 · 获赞 1 · 访问量 1467

猜你喜欢

转载自blog.csdn.net/qq_41891805/article/details/104851849