XML的定义、语法、约束与解析__Java实例

XML：是可扩展的标记语言，所有的标签都是可自定义的。
常用于数据存储、配置文件和数据传输。（Java框架配置文件会用到）

html与xml的区别：
html用来做页面展示，xml用来做数据存储
html的所有标签都是预定义的，xml所有标签都是自定义的
xml标签区分大小写

xml语法：

<?xml version="1.0" encoding="UTF-8"?>

<books>
	<book>
		<name>c++</name>	
		<price>66</price>
	</book>
	<book>
		<name>c</name>	
		<price>77</price>
	</book>
</books>

文档说明：必须写在xml文档中的第一行 <?xml version="1.0" encoding="utf-8"?>
standalone:指定文档是否独立，yes或no
元素：xml文档中的标签，文档中必须有且只有一个根元素，元素需要闭合，正确嵌套，区分大小写，数字不能开头
文本：转义字符 >
CDATA：里边的数据会原样显示; <![CDATA[数据内容]]>
属性：属性值必须使用引号引起来

xml约束 :
dtd:
  内部dtd:在xml内部定义dtd
  外部dtd:在外部文件中定义dtd
   本地的dtd文件：<!DOCTYPE students SYSTEM "student.dtd">
   网络的dtd文件：<!DOCTYPE students PUBLIC "名称空间(路径)" "student.dtd">

<!ELEMENT students (student*)>
<!ELEMENT student (name,age,sex)>
<!ELEMENT name (#PCDATA)>
<!ELEMENT age (#PCDATA)>
<!ELEMENT sex (#PCDATA)>
<!ATTLIST student number ID #REQUIRED>

schema:
导入xsd约束文档：

<?xml version="1.0"?>
<xsd:schema xmlns="http://www.kk.cn/xml"
        xmlns:xsd="http://www.w3.org/2001/XMLSchema"
        targetNamespace="http://www.kk.cn/xml" elementFormDefault="qualified">
    <xsd:element name="students" type="studentsType"/>
    <xsd:complexType name="studentsType">
        <xsd:sequence>
            <xsd:element name="student" type="studentType" minOccurs="0" maxOccurs="unbounded"/>
        </xsd:sequence>
    </xsd:complexType>
    <xsd:complexType name="studentType">
        <xsd:sequence>
            <xsd:element name="name" type="xsd:string"/>
            <xsd:element name="age" type="ageType" />
            <xsd:element name="sex" type="sexType" />
        </xsd:sequence>
        <xsd:attribute name="number" type="numberType" use="required"/>
    </xsd:complexType>
    <xsd:simpleType name="sexType">
        <xsd:restriction base="xsd:string">
            <xsd:enumeration value="male"/>
            <xsd:enumeration value="female"/>
        </xsd:restriction>
    </xsd:simpleType>
    <xsd:simpleType name="ageType">
        <xsd:restriction base="xsd:integer">
            <xsd:minInclusive value="0"/>
            <xsd:maxInclusive value="256"/>
        </xsd:restriction>
    </xsd:simpleType>
    <xsd:simpleType name="numberType">
        <xsd:restriction base="xsd:string">
            <xsd:pattern value="kk_\d{4}"/>
        </xsd:restriction>
    </xsd:simpleType>

<?xml version="1.0" encoding="UTF-8" ?>
<!-- 
	1、编写根标签
	2、引入实例名称空间 xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
	3、引入名称空间 xsi:schemaLocation="http://www.itcast.cn/xml student.xsd"	
	4、引入默认的名称空间
	
	<!DOCTYPE student SYSTEM "student.dtd">
 -->
<students 
	xmlns="http://www.kk.cn/xml"
	xsi:schemaLocation="http://www.kk.cn/xml student.xsd"
	xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
>
	<student number="kk_1001">
		<name>asfd</name>
		<age>12</age>
		<sex>male</sex>
	</student>
	
</students>

XML解析：
解析xml可以做：
  如果xml作为配置文件：读取
  如果xml作为传输文件：写，读
xml解析思想：
  DOM：将文档加载进内存，形成一颗dom树(document对象)，将文档的各个组成部分封装为一些对象。
   优点：因为，在内存中会形成dom树，可以对dom树进行增删改查。
   缺点：dom树非常占内存，解析速度慢。

   Document
   Element
   Text
   Attribute
   Comment

  SAX：逐行读取，基于事件驱动
   优点：不占内存，速度快
   缺点：只能读取，不能回写

xml常用的解析器：
  DOM4J：怎么用查文档
   1.导入jar包 dom4j.jar
   2.创建解析器
    SAXReader reader = new SAXReader();
   3.解析xml 获得document对象
    Document document = reader.read(url);

package dom4j;

import java.util.List;

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.Node;
import org.dom4j.io.SAXReader;
import org.junit.Test;

public class TestDom4j {
	@Test
	public void test1() throws Exception{
		SAXReader reader = new SAXReader();	//创建一个xml解析对象
		Document document = reader.read("src/book.xml");//把xml文档加载到document对象中
		
		Element root=document.getRootElement();
		/*
		Element bookNode=root.element("book");
		System.out.println(bookNode.getName());
		*/
		List list=root.elements();	//得到当前节点的所有子节点
		Element secondbook=(Element) list.get(1);	//得到第二本书的对象
		String name=secondbook.element("name").getText();//得到当前节点的文本内容
		System.out.println(name);
	}
	@Test
	public void test2() throws DocumentException{
		SAXReader reader = new SAXReader();	//创建一个xml解析对象
		Document document = reader.read("src/book.xml");//把xml文档加载到document对象中
		Element root=document.getRootElement();
		treewalk(root);
	}
	private void treewalk(Element ele){
		System.out.println(ele.getName());	//输出当前节点的名字
		for(int i=0;i<ele.nodeCount();i++){		//ele.nodeCount()得到当前节点的所有子节点的数量
			Node node=ele.node(i);//取出下标为i的节点
			if(node instanceof Element){//判断当前节点是否为标签
				treewalk((Element)node);//把node强转为标签Element
			}
		}
	}
	
}

XPATH：专门用于查询
    定义了一种规则。
    使用的方法：
     selectSingleNode():
     selectNodes():
   使用步骤：
    1、注意：要导包 jaxen...jar
    2、创建解析器
     SAXReader reader = new SAXReader();
    3、解析xml 获得document对象
     Document document = reader.read(url);

解析XML：
         1、得到某个具体的节点内容:第2本书的书名-->c
  2、遍历所有元素节点

XPath：  具体怎么用，需要查文档
   nodename 选取此节点。
     从根节点选取。
     从匹配选择的当前节点选择文档中的节点，而不考虑它们的位置。
   .. 选取当前节点的父节点。
   @ 选取属性。
        [@属性名]    属性过滤
          [标签名]     子元素过滤

package dom4j;

import java.util.List;

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.Node;
import org.dom4j.io.SAXReader;
import org.junit.Test;

public class TestXPath {
	@Test
	public void test() throws Exception{
		SAXReader reader = new SAXReader();	//创建一个xml解析对象
		Document document = reader.read("src/book.xml");//把xml文档加载到document对象中
		Node node=document.selectSingleNode("/books/book[2]/name");
		System.out.println(node.getText());
	}
	@Test
	public void test2() throws Exception{
		SAXReader reader = new SAXReader();	//创建一个xml解析对象
		Document document = reader.read("src/book.xml");//把xml文档加载到document对象中
		List list=document.selectNodes("//*");			//		//*去所有节点   忽略深度
		for(int i=0;i<list.size();i++){
			Node node=(Node)list.get(i);
			System.out.println(node.getName());
		}
	}
}

XML的定义、语法、约束与解析__Java实例

猜你喜欢