dom4j简单学习 element和node的区别

使用dom4j解析处理html时,遇到一些麻烦的问题:

 
基中必须要使用XPath取得节点,有个命名空间的问题,需要如下处理:
HashMap<String, String> gm = new HashMap<String, String>();
gm.put("xmlns", "http://www.w3.org/1999/xhtml");
Document rootDoc = DocumentHelper.parseText(s);
XPath xpathTable = DocumentHelper
.createXPath("//xmlns:table[@class=\"tableList\"]");
xpathTable.setNamespaceURIs(gm);
List<Node> tables = xpathTable.selectNodes(rootDoc);
 
现在取出来是Node对象(比如一个table),再往下取时,再用node1.selectNodes会取不到东西,可能还是因为命名空间的麻烦问题,所以最好转为Element,就很容易了,element1.elements("tr"),就可以方便地循环了,比较奇怪的是转换为Element的方法居然是强转-_-!
Element table1 = (Element) tables.get(0); // 第一个表格
由此可以这样理解Node和Element,Node是节点,一个属性、一段文字、一个注释等都是节点,而Element是元素,是比较完整的一个xml的元素,即我们口头上说的xml“结点”(此处故意使用“结”字,以示与“节点”Node区别),呵呵……

 

dom4j帮助文档在dom4j-1.6.1/docs/guide.html文件里面,全部是英文,但是基本上应该能看懂。

 

1、  四种操作xml的方式:SAX,DOM,JDOM,DOM4J.

2、  DOM(Document Object Model):意思是把整个xml做为一个整体对象,直接全部放到内存里面,不管xml文件有多大;

3、  SAX=Sample API for XML:假如xml文件有2G,用第一种方式,是很困难的,SAX用的是一种类似流媒体方式进行的。

DOM和SAX是java的API,处理xml文件的时候,相对来说是比较困难的,于是出现了下面两种框架,包装了上面两个框架。

4、  JDOM:

5、  DOM4J:

扫描二维码关注公众号,回复: 4659677 查看本文章

6、  利用DOM4J解析xml文件(读取所有的属性节点)。

Document可以理解为整个文档对象

取root节点。Document.getRootElement()返回的是一个Element(元素)

7、  理解运用xpath,path就是路径,xpath在xml文件里面找到特定的节点。

Document.selectNodes(“//hibernate-mapping/class/property”)  //其中hibenate-mapping是根节点。做变org.dom4j.Node对象返回的。

Document.selectSingleNodes(“//hibernate-mapping/class/property”)//只拿第一个。

基中@name是property的属性名valueOf是拿出name的值;

需要加入DOM4J里面的jaxen包

8、  DOM4J的生成xml文件

9、  用FileWriter生成xml文件的时候,可能没有格式,可以用XMLWriter类,这样自动进行美化。

10、  DOM4J修改xml文件;很少用。

11、  自动生成代码往往用的是:freemarker或velocity,这是常用的。用dom4j生成也很少用。

12、  怎么用表里面的结构生成xml文件。

13、 JavaDB

a)       Properties对象:可以理解为一个表格对应key,value

14、  Databasemetadata,可以能过这个JDK类,读取数据库的表结构,通过这个表结构做一些自己的事情。(熟悉用法)通过JDK文档和google学习

15、   元数据就是数据的数据,用来描述数据的数据。

16、   DWR,对Ajax框架封住得比较好,是类和java的结合。


dom4j学习实例:

 

[java]  view plain copy
 
  1. package hb.dom4j;  
  2.   
  3. import java.io.FileWriter;  
  4. import java.io.IOException;  
  5. import java.util.Iterator;  
  6. import java.util.List;  
  7.   
  8. import org.dom4j.Attribute;  
  9. import org.dom4j.Document;  
  10. import org.dom4j.DocumentException;  
  11. import org.dom4j.DocumentHelper;  
  12. import org.dom4j.Element;  
  13. import org.dom4j.Node;  
  14. import org.dom4j.io.OutputFormat;  
  15. import org.dom4j.io.SAXReader;  
  16. import org.dom4j.io.XMLWriter;  
  17.   
  18. public class MyJdomReaderXML {  
  19.     public Document parse(String string) throws DocumentException {  
  20.         SAXReader reader = new SAXReader();  
  21.         Document document = reader.read(string);  
  22.         return document;  
  23.     }  
  24.   
  25.     public void bar(Document document) throws DocumentException {  
  26.           
  27.         Element root = document.getRootElement();//获得根节点;  
  28.         //进行迭代;读取根节点下的所有节点和子节点下的所有节点  
  29.         for (Iterator i = root.elementIterator(); i.hasNext();) {  
  30.             Element element = (Element) i.next();  
  31.             System.out.println(element.getName());  
  32.             for (Iterator j = element.elementIterator(); j.hasNext();) {  
  33.                 System.out.println(((Element) j.next()).getName());  
  34.             }  
  35.         }  
  36.           
  37.         //读取节点名为foo的所有子节点  
  38.         for (Iterator i = root.elementIterator("foo"); i.hasNext();) {  
  39.             Element foo = (Element) i.next();  
  40.             System.out.println(foo.getName());  
  41.         }  
  42.           
  43.         //读取根节点的所有属性  
  44.         for (Iterator i = root.attributeIterator(); i.hasNext();) {  
  45.             Attribute attribute = (Attribute) i.next();  
  46.             System.out.println(attribute.getName());  
  47.         }  
  48.     }  
  49.       
  50.     /* 
  51.      * 可以根据节点名字读取节点,也可以读取节点里的key和value 
  52.      */  
  53.     public void readNodes(Document document) {  
  54.         List list = document.selectNodes( "//foo/bar" );   //foo为根节点,获得根节点下的bar节点  
  55.         Node node = document.selectSingleNode( "//foo/bar/author" );  //获得名为author的第一 节点  
  56.         String name = node.valueOf( "@name" ); //获得节点名属性名为name的value  
  57.     }  
  58.       
  59.     /* 
  60.      * 如果xml文件很大的情况下,用上面的方法很费时,这样 可以用递归遍历整个xml文件 
  61.      */  
  62.     public void treeWalk(Document document) {  
  63.         treeWalk(document.getRootElement());  
  64.     }  
  65.   
  66.     /* 
  67.      * 递归调用,传递每一个父节点做为参数 
  68.      */  
  69.     public void treeWalk(Element element) {  
  70.         for (int i = 0, size = element.nodeCount(); i < size; i++) {  
  71.             Node node = element.node(i);  
  72.             if (node instanceof Element) {//如果node实现了Element接口,那么就表示node是一个节点。再递归  
  73.                 treeWalk((Element) node);  
  74.                 System.out.println(((Element) node).getName()+":"+node.valueOf("@name"));  
  75.             } else {//如果没有实现Element接口,那么就表示这个node不是节点了,输出节点等操作;  
  76.             }  
  77.         }  
  78.     }  
  79.   
  80.     //获得节点属性名key为name的value  
  81.     public void findLinks(Document document) throws DocumentException {  
  82.         List list = document.selectNodes( "//ehcache/cache/@name" );  
  83.         for (Iterator iter = list.iterator(); iter.hasNext(); ) {  
  84.             Attribute attribute = (Attribute) iter.next();  
  85.             String url = attribute.getValue();  
  86.             System.out.println(url);  
  87.         }  
  88.     }  
  89.       
  90.     /* 
  91.      * 创建一个documnet文档 
  92.      */  
  93.      public Document createDocument() {  
  94.             Document document = DocumentHelper.createDocument();  
  95.             Element root = document.addElement( "root" );  
  96.   
  97.             Element author1 = root.addElement( "author" )  
  98.                 .addAttribute( "name""James" )  
  99.                 .addAttribute( "location""UK" )  
  100.                 .addText( "James Strachan" );  
  101.               
  102.             Element author2 = root.addElement( "author" )  
  103.                 .addAttribute( "name""Bob" )  
  104.                 .addAttribute( "location""US" )  
  105.                 .addText( "Bob McWhirter" );  
  106.             return document;  
  107.         }  
  108.        
  109.      //写入xml文件  
  110.      public void write(Document document) throws IOException {  
  111.   
  112.             // lets write to a file  
  113.             XMLWriter writer = new XMLWriter(  
  114.                 new FileWriter( "output.xml" )  
  115.             );  
  116.             writer.write( document );  
  117.             writer.close();  
  118.   
  119.   
  120.             // Pretty print the document to System.out  
  121.             OutputFormat format = OutputFormat.createPrettyPrint();  
  122.             writer = new XMLWriter( System.out, format );  
  123.             writer.write( document );  
  124.   
  125.             // Compact format to System.out  
  126.             format = OutputFormat.createCompactFormat();  
  127.             writer = new XMLWriter( System.out, format );  
  128.             writer.write( document );  
  129.         }  
  130.        
  131.     /* 
  132.      * 主函数,用来测试 
  133.      */  
  134.     public static void main(String[] args) throws DocumentException,  
  135.             IOException {  
  136.         MyJdomReaderXML mjrx = new MyJdomReaderXML();  
  137.         Document d = mjrx.parse("test.xml");  
  138.         mjrx.bar(d);  
  139.         System.out.println("------one----------");  
  140.         mjrx.treeWalk(d);  
  141.         System.out.println("------two----------");  
  142.         mjrx.findLinks(d);  
  143.     }  
  144. }  

 

  元素(Element)和结点(Node)有区别,节点包含了元素,元素一定是节点,而必须是含有完整信息的结点才是一个元素。

再分享一下我老师大神的人工智能教程吧。零基础!通俗易懂!风趣幽默!还带黄段子!希望你也加入到我们人工智能的队伍中来!https://www.cnblogs.com/captainbed

猜你喜欢

转载自www.cnblogs.com/skinchqqhah/p/10180911.html