Java解析xml的四种方式

第一种:DOM。


DOM的全称是Document Object Model,也即文档对象模型。在应用程序中,基于DOM的XML分析器将一个XML文档转换成一个对象模型的集合(通常称DOM树),应用程序正是通过对这个对象模型的操作,来实现对XML文档数据的操作。通过DOM接口,应用程序可以在任何时候访问XML文档中的任何一部分数据,因此,这种利用DOM接口的机制也被称作随机访问机制。

DOM接口提供了一种通过分层对象模型来访问XML文档信息的方式,这些分层对象模型依据XML的文档结构形成了一棵节点树。无论XML文档中所描述的是什么类型的信息,即便是制表数据、项目列表或一个文档,利用DOM所生成的模型都是节点树的形式。也就是说,DOM强制使用树模型来访问XML文档中的信息。由于XML本质上就是一种分层结构,所以这种描述方法是相当有效的。

DOM树所提供的随机访问方式给应用程序的开发带来了很大的灵活性,它可以任意地控制整个XML文档中的内容。然而,由于DOM分析器把整个XML文档转化成DOM树放在了内存中,因此,当文档比较大或者结构比较复杂时,对内存的需求就比较高。而且,对于结构复杂的树的遍历也是一项耗时的操作。所以,DOM分析器对机器性能的要求比较高,实现效率不十分理想。不过,由于DOM分析器所采用的树结构的思想与XML文档的结构相吻合,同时鉴于随机访问所带来的方便,因此,DOM分析器还是有很广泛的使用价值的。

Java代码 收藏代码
  1. importjava.io.File;
  2. importjavax.xml.parsers.DocumentBuilder;
  3. importjavax.xml.parsers.DocumentBuilderFactory;
  4. importorg.w3c.dom.Document;
  5. importorg.w3c.dom.Element;
  6. importorg.w3c.dom.NodeList;
  7. publicclassDomTest1
  8. {
  9. publicstaticvoidmain(String[]args)throwsException
  10. {
  11. //step1:获得dom解析器工厂(工作的作用是用于创建具体的解析器)
  12. DocumentBuilderFactorydbf=DocumentBuilderFactory.newInstance();
  13. //System.out.println("classname:"+dbf.getClass().getName());
  14. //step2:获得具体的dom解析器
  15. DocumentBuilderdb=dbf.newDocumentBuilder();
  16. //System.out.println("classname:"+db.getClass().getName());
  17. //step3:解析一个xml文档,获得Document对象(根结点)
  18. Documentdocument=db.parse(newFile("candidate.xml"));
  19. NodeListlist=document.getElementsByTagName("PERSON");
  20. for(inti=0;i<list.getLength();i++)
  21. {
  22. Elementelement=(Element)list.item(i);
  23. Stringcontent=element.getElementsByTagName("NAME").item(0).getFirstChild().getNodeValue();
  24. System.out.println("name:"+content);
  25. content=element.getElementsByTagName("ADDRESS").item(0).getFirstChild().getNodeValue();
  26. System.out.println("address:"+content);
  27. content=element.getElementsByTagName("TEL").item(0).getFirstChild().getNodeValue();
  28. System.out.println("tel:"+content);
  29. content=element.getElementsByTagName("FAX").item(0).getFirstChild().getNodeValue();
  30. System.out.println("fax:"+content);
  31. content=element.getElementsByTagName("EMAIL").item(0).getFirstChild().getNodeValue();
  32. System.out.println("email:"+content);
  33. System.out.println("--------------------------------------");
  34. }
  35. }
  36. }
Java代码 收藏代码
  1. importjava.io.File;
  2. importjavax.xml.parsers.DocumentBuilder;
  3. importjavax.xml.parsers.DocumentBuilderFactory;
  4. importorg.w3c.dom.Attr;
  5. importorg.w3c.dom.Comment;
  6. importorg.w3c.dom.Document;
  7. importorg.w3c.dom.Element;
  8. importorg.w3c.dom.NamedNodeMap;
  9. importorg.w3c.dom.Node;
  10. importorg.w3c.dom.NodeList;
  11. /**
  12. *使用递归解析给定的任意一个xml文档并且将其内容输出到命令行上
  13. *@authorzhanglong
  14. *
  15. */
  16. publicclassDomTest3
  17. {
  18. publicstaticvoidmain(String[]args)throwsException
  19. {
  20. DocumentBuilderFactorydbf=DocumentBuilderFactory.newInstance();
  21. DocumentBuilderdb=dbf.newDocumentBuilder();
  22. Documentdoc=db.parse(newFile("student.xml"));
  23. //获得根元素结点
  24. Elementroot=doc.getDocumentElement();
  25. parseElement(root);
  26. }
  27. privatestaticvoidparseElement(Elementelement)
  28. {
  29. StringtagName=element.getNodeName();
  30. NodeListchildren=element.getChildNodes();
  31. System.out.print("<"+tagName);
  32. //element元素的所有属性所构成的NamedNodeMap对象,需要对其进行判断
  33. NamedNodeMapmap=element.getAttributes();
  34. //如果该元素存在属性
  35. if(null!=map)
  36. {
  37. for(inti=0;i<map.getLength();i++)
  38. {
  39. //获得该元素的每一个属性
  40. Attrattr=(Attr)map.item(i);
  41. StringattrName=attr.getName();
  42. StringattrValue=attr.getValue();
  43. System.out.print(""+attrName+"=\""+attrValue+"\"");
  44. }
  45. }
  46. System.out.print(">");
  47. for(inti=0;i<children.getLength();i++)
  48. {
  49. Nodenode=children.item(i);
  50. //获得结点的类型
  51. shortnodeType=node.getNodeType();
  52. if(nodeType==Node.ELEMENT_NODE)
  53. {
  54. //是元素,继续递归
  55. parseElement((Element)node);
  56. }
  57. elseif(nodeType==Node.TEXT_NODE)
  58. {
  59. //递归出口
  60. System.out.print(node.getNodeValue());
  61. }
  62. elseif(nodeType==Node.COMMENT_NODE)
  63. {
  64. System.out.print("<!--");
  65. Commentcomment=(Comment)node;
  66. //注释内容
  67. Stringdata=comment.getData();
  68. System.out.print(data);
  69. System.out.print("-->");
  70. }
  71. }
  72. System.out.print("</"+tagName+">");
  73. }
  74. }


sax:SAX的全称是Simple APIs for XML,也即XML简单应用程序接口。与DOM不同,SAX提供的访问模式是一种顺序模式,这是一种快速读写XML数据的方式。当使用SAX分析器对XML文档进行分析时,会触发一系列事件,并激活相应的事件处理函数,应用程序通过这些事件处理函数实现对XML文档的访问,因而SAX接口也被称作事件驱动接口。

Java代码 收藏代码
  1. importjava.io.File;
  2. importjavax.xml.parsers.SAXParser;
  3. importjavax.xml.parsers.SAXParserFactory;
  4. importorg.xml.sax.Attributes;
  5. importorg.xml.sax.SAXException;
  6. importorg.xml.sax.helpers.DefaultHandler;
  7. publicclassSaxTest1
  8. {
  9. publicstaticvoidmain(String[]args)throwsException
  10. {
  11. //step1:获得SAX解析器工厂实例
  12. SAXParserFactoryfactory=SAXParserFactory.newInstance();
  13. //step2:获得SAX解析器实例
  14. SAXParserparser=factory.newSAXParser();
  15. //step3:开始进行解析
  16. parser.parse(newFile("student.xml"),newMyHandler());
  17. }
  18. }
  19. classMyHandlerextendsDefaultHandler
  20. {
  21. @Override
  22. publicvoidstartDocument()throwsSAXException
  23. {
  24. System.out.println("parsebegan");
  25. }
  26. @Override
  27. publicvoidendDocument()throwsSAXException
  28. {
  29. System.out.println("parsefinished");
  30. }
  31. @Override
  32. publicvoidstartElement(Stringuri,StringlocalName,StringqName,
  33. Attributesattributes)throwsSAXException
  34. {
  35. System.out.println("startelement");
  36. }
  37. @Override
  38. publicvoidendElement(Stringuri,StringlocalName,StringqName)
  39. throwsSAXException
  40. {
  41. System.out.println("finishelement");
  42. }
  43. }
Java代码 收藏代码
  1. importjava.io.File;
  2. importjava.util.Stack;
  3. importjavax.xml.parsers.SAXParser;
  4. importjavax.xml.parsers.SAXParserFactory;
  5. importorg.xml.sax.Attributes;
  6. importorg.xml.sax.SAXException;
  7. importorg.xml.sax.helpers.DefaultHandler;
  8. publicclassSaxTest2
  9. {
  10. publicstaticvoidmain(String[]args)throwsException
  11. {
  12. SAXParserFactoryfactory=SAXParserFactory.newInstance();
  13. SAXParserparser=factory.newSAXParser();
  14. parser.parse(newFile("student.xml"),newMyHandler2());
  15. }
  16. }
  17. classMyHandler2extendsDefaultHandler
  18. {
  19. privateStack<String>stack=newStack<String>();
  20. privateStringname;
  21. privateStringgender;
  22. privateStringage;
  23. @Override
  24. publicvoidstartElement(Stringuri,StringlocalName,StringqName,
  25. Attributesattributes)throwsSAXException
  26. {
  27. stack.push(qName);
  28. for(inti=0;i<attributes.getLength();i++)
  29. {
  30. StringattrName=attributes.getQName(i);
  31. StringattrValue=attributes.getValue(i);
  32. System.out.println(attrName+"="+attrValue);
  33. }
  34. }
  35. @Override
  36. publicvoidcharacters(char[]ch,intstart,intlength)
  37. throwsSAXException
  38. {
  39. Stringtag=stack.peek();
  40. if("姓名".equals(tag))
  41. {
  42. name=newString(ch,start,length);
  43. }
  44. elseif("性别".equals(tag))
  45. {
  46. gender=newString(ch,start,length);
  47. }
  48. elseif("年龄".equals(tag))
  49. {
  50. age=newString(ch,start,length);
  51. }
  52. }
  53. @Override
  54. publicvoidendElement(Stringuri,StringlocalName,StringqName)
  55. throwsSAXException
  56. {
  57. stack.pop();//表示该元素已经解析完毕,需要从栈中弹出
  58. if("学生".equals(qName))
  59. {
  60. System.out.println("姓名:"+name);
  61. System.out.println("性别:"+gender);
  62. System.out.println("年龄:"+age);
  63. System.out.println();
  64. }
  65. }
  66. }

JDOM:

JDOM是一个开源项目,它基于树型结构,利用纯JAVA的技术对XML文档实现解析、生成、序列化以及多种操作。(http://jdom.org)

•JDOM 直接为JAVA编程服务。它利用更为强有力的JAVA语言的诸多特性(方法重载、集合概念等),把SAX和DOM的功能有效地结合起来。

•JDOM是用Java语言读、写、操作XML的新API函数。在直接、简单和高效的前提下,这些API函数被最大限度的优化。

jdom创建xml

Java代码 收藏代码
  1. importjava.io.FileWriter;
  2. importorg.jdom.Attribute;
  3. importorg.jdom.Comment;
  4. importorg.jdom.Document;
  5. importorg.jdom.Element;
  6. importorg.jdom.output.Format;
  7. importorg.jdom.output.XMLOutputter;
  8. publicclassJDomTest1
  9. {
  10. publicstaticvoidmain(String[]args)throwsException
  11. {
  12. Documentdocument=newDocument();
  13. Elementroot=newElement("root");
  14. document.addContent(root);
  15. Commentcomment=newComment("Thisismycomments");
  16. root.addContent(comment);
  17. Elemente=newElement("hello");
  18. e.setAttribute("sohu","www.sohu.com");
  19. root.addContent(e);
  20. Elemente2=newElement("world");
  21. Attributeattr=newAttribute("test","hehe");
  22. e2.setAttribute(attr);
  23. e.addContent(e2);
  24. e2.addContent(newElement("aaa").setAttribute("a","b")
  25. .setAttribute("x","y").setAttribute("gg","hh").setText("textcontent"));
  26. Formatformat=Format.getPrettyFormat();
  27. format.setIndent("");
  28. //format.setEncoding("gbk");
  29. XMLOutputterout=newXMLOutputter(format);
  30. out.output(document,newFileWriter("jdom.xml"));
  31. }
  32. }

JDOM解析xml

Java代码 收藏代码
  1. importjava.io.File;
  2. importjava.io.FileOutputStream;
  3. importjava.util.List;
  4. importorg.jdom.Attribute;
  5. importorg.jdom.Document;
  6. importorg.jdom.Element;
  7. importorg.jdom.input.SAXBuilder;
  8. importorg.jdom.output.Format;
  9. importorg.jdom.output.XMLOutputter;
  10. publicclassJDomTest2
  11. {
  12. publicstaticvoidmain(String[]args)throwsException
  13. {
  14. SAXBuilderbuilder=newSAXBuilder();
  15. Documentdoc=builder.build(newFile("jdom.xml"));
  16. Elementelement=doc.getRootElement();
  17. System.out.println(element.getName());
  18. Elementhello=element.getChild("hello");
  19. System.out.println(hello.getText());
  20. Listlist=hello.getAttributes();
  21. for(inti=0;i<list.size();i++)
  22. {
  23. Attributeattr=(Attribute)list.get(i);
  24. StringattrName=attr.getName();
  25. StringattrValue=attr.getValue();
  26. System.out.println(attrName+"="+attrValue);
  27. }
  28. hello.removeChild("world");
  29. XMLOutputterout=newXMLOutputter(Format.getPrettyFormat().setIndent(""));
  30. out.output(doc,newFileOutputStream("jdom2.xml"));
  31. }
  32. }

Dom4j

Java代码 收藏代码
  1. importjava.io.FileOutputStream;
  2. importjava.io.FileWriter;
  3. importorg.dom4j.Document;
  4. importorg.dom4j.DocumentHelper;
  5. importorg.dom4j.Element;
  6. importorg.dom4j.io.OutputFormat;
  7. importorg.dom4j.io.XMLWriter;
  8. publicclassTest1
  9. {
  10. publicstaticvoidmain(String[]args)throwsException
  11. {
  12. //创建文档并设置文档的根元素节点:第一种方式
  13. //Documentdocument=DocumentHelper.createDocument();
  14. //
  15. //Elementroot=DocumentHelper.createElement("student");
  16. //
  17. //document.setRootElement(root);
  18. //创建文档并设置文档的根元素节点:第二种方式
  19. Elementroot=DocumentHelper.createElement("student");
  20. Documentdocument=DocumentHelper.createDocument(root);
  21. root.addAttribute("name","zhangsan");
  22. ElementhelloElement=root.addElement("hello");
  23. ElementworldElement=root.addElement("world");
  24. helloElement.setText("hello");
  25. worldElement.setText("world");
  26. helloElement.addAttribute("age","20");
  27. XMLWriterxmlWriter=newXMLWriter();
  28. xmlWriter.write(document);
  29. OutputFormatformat=newOutputFormat("",true);
  30. XMLWriterxmlWriter2=newXMLWriter(newFileOutputStream("student2.xml"),format);
  31. xmlWriter2.write(document);
  32. XMLWriterxmlWriter3=newXMLWriter(newFileWriter("student3.xml"),format);
  33. xmlWriter3.write(document);
  34. xmlWriter3.close();
  35. }
  36. }
Java代码 收藏代码
  1. importjava.io.File;
  2. importjava.util.Iterator;
  3. importjava.util.List;
  4. importjavax.xml.parsers.DocumentBuilder;
  5. importjavax.xml.parsers.DocumentBuilderFactory;
  6. importorg.dom4j.Document;
  7. importorg.dom4j.Element;
  8. importorg.dom4j.io.DOMReader;
  9. importorg.dom4j.io.SAXReader;
  10. publicclassTest2
  11. {
  12. publicstaticvoidmain(String[]args)throwsException
  13. {
  14. SAXReadersaxReader=newSAXReader();
  15. Documentdoc=saxReader.read(newFile("student2.xml"));
  16. Elementroot=doc.getRootElement();
  17. System.out.println("rootelement:"+root.getName());
  18. ListchildList=root.elements();
  19. System.out.println(childList.size());
  20. ListchildList2=root.elements("hello");
  21. System.out.println(childList2.size());
  22. Elementfirst=root.element("hello");
  23. System.out.println(first.attributeValue("age"));
  24. for(Iteratoriter=root.elementIterator();iter.hasNext();)
  25. {
  26. Elemente=(Element)iter.next();
  27. System.out.println(e.attributeValue("age"));
  28. }
  29. System.out.println("---------------------------");
  30. DocumentBuilderFactorydbf=DocumentBuilderFactory.newInstance();
  31. DocumentBuilderdb=dbf.newDocumentBuilder();
  32. org.w3c.dom.Documentdocument=db.parse(newFile("student2.xml"));
  33. DOMReaderdomReader=newDOMReader();
  34. //将JAXP的Document转换为dom4j的Document
  35. Documentd=domReader.read(document);
  36. ElementrootElement=d.getRootElement();
  37. System.out.println(rootElement.getName());
  38. }
  39. }
Java代码 收藏代码
    1. importjava.io.FileWriter;
    2. importorg.jdom.Attribute;
    3. importorg.jdom.Document;
    4. importorg.jdom.Element;
    5. importorg.jdom.output.Format;
    6. importorg.jdom.output.XMLOutputter;
    7. publicclassTest3
    8. {
    9. publicstaticvoidmain(String[]args)throwsException
    10. {
    11. Documentdocument=newDocument();
    12. Elementroot=newElement("联系人列表").setAttribute(newAttribute("公司",
    13. "A集团"));
    14. document.addContent(root);
    15. ElementcontactPerson=newElement("联系人");
    16. root.addContent(contactPerson);
    17. contactPerson
    18. .addContent(newElement("姓名").setText("张三"))
    19. .addContent(newElement("公司").setText("A公司"))
    20. .addContent(newElement("电话").setText("021-55556666"))
    21. .addContent(
    22. newElement("地址")
    23. .addContent(newElement("街道").setText("5街"))
    24. .addContent(newElement("城市").setText("上海"))
    25. .addContent(newElement("省份").setText("上海市")));
    26. XMLOutputteroutput=newXMLOutputter(Format.getPrettyFormat()
    27. .setIndent("").setEncoding("gbk"));
    28. output.output(document,newFileWriter("contact.xml"));
    29. }
    30. }

转自:http://inotgaoshou.iteye.com/blog/1012188

猜你喜欢

转载自wjy320.iteye.com/blog/1999872