XML解析
开发中比较常见的解析方式有三种,如下:
DOM:要求解析器把整个XML文档装载到内存,并解析成一个Document对象。
SAX:是一种速度更快,更有效的方法。它逐行扫描文档,一边扫描一边解析。并以事件 驱动的方式进行具体解析,每执行一行,都将触发对应的事件。
PULL: Android内置的XML解析方式,类似SAX。
解析器就是根据不同的解析方式提供的具体实现。有的解析器操作过于繁琐,为了方便开发人员,有提供易于操作的解析开发包。
常见的解析开发包:
JAXP: sun公司提供支持DOM和SAX开发包
JDom:dom4j兄弟
jsoup:一种处理HTML特定解析开发包
dom4j:比较常用的解析开发包,hibernate底层采用。
dom4j解析:
XML DOM将整个XML文档加载到内存,生成一个DOM树,
并获得一个Document对象,通过Document对象就可以对DOM进行操作。DOM中的核心概念就是节点,在XML文档中的元素、属性、文本等,在DOM中都是节点。
准备:需要dom4j.jar,并导入项目路径下。
dom4j必须使用核心类SaxReader加载xml文档获得Document通过Document对象获得文档的根元素,然后就可以操作了。
步骤:
1.获取解析器
2.获得document文档对象
3.获取根元素
4.获取根元素下的子元素
5.遍历子元素
6.判断元素名称为servlet的元素
import java.util.List; import org.dom4j.Document; import org.dom4j.DocumentException; import org.dom4j.Element; import org.dom4j.io.SAXReader; import org.junit.Test; public class TestDom4j { @Test public void testReadWebXML() { try { // 1.获取解析器 SAXReader saxReader = new SAXReader(); // 2.获得document文档对象 Document doc = saxReader.read("src/com/oracle/demo06/web.xml"); // 3.获取根元素 Element rootElement = doc.getRootElement(); // System.out.println(rootElement.getName());//获取根元素的名称 // System.out.println(rootElement.attributeValue("version"));//获取根元素中的属性值 // 4.获取根元素下的子元素 List<Element> childElements = rootElement.elements(); // 5.遍历子元素 for (Element element : childElements) { //6.判断元素名称为servlet的元素 if ("servlet".equals(element.getName())) { //7.获取servlet-name元素 Element servletName = element.element("servlet-name"); //8.获取servlet-class元素 Element servletClass = element.element("servlet-class"); System.out.println(servletName.getText()); System.out.println(servletClass.getText()); } } } catch (DocumentException e) { e.printStackTrace(); } } }
7.获取servlet-name元素
8.获取servlet-class元素