Jsoup 快捷查询方式

一、selector 选择器

使用的方法:Elements	select​(String cssQuery)
语法:参考 Selector 类中定义的语法
public class JsoupDemo {
    public static void main(String[] args) throws Exception{
        String path = JsoupDemo.class.getClassLoader().getResource("student.xml").getPath();
        //解析xml文档,加载文档进内存,获取dom树--->Document
        Document document = Jsoup.parse(new File(path),"utf-8");

//        查询 name 标签
        Elements elements = document.select("name");

//        查询 id 值为 1 的元素
        Elements elements1 = document.select("#1");

//        获取 student 标签并且 id 属性为 1 的 age 子标签
        Elements elements2 = document.select("student[id=\"1\"]");
        Elements elements3 = document.select("student[id=\"1\"]>age");
        System.out.println(elements3);
    }
}

二、XPath

XPath即为XML路径语言,它是一种用来确定XML(标准通用标记语言的子集)文档中某部分位置的语言

* 使用Jsoup的Xpath需要额外导入jar包。
* 查询w3cshool参考手册,使用xpath的语法完成查询

在这里插入图片描述

//1.获取student.xml的path
String path = JsoupDemo6.class.getClassLoader().getResource("student.xml").getPath();
//2.获取Document对象
Document document = Jsoup.parse(new File(path), "utf-8");
			
//3.根据document对象,创建JXDocument对象
JXDocument jxDocument = new JXDocument(document);
			
//4.结合xpath语法查询
	//4.1查询所有student标签
List<JXNode> jxNodes = jxDocument.selN("//student");
for (JXNode jxNode : jxNodes) {
		 System.out.println(jxNode);
}
			
	//4.2查询所有student标签下的name标签
List<JXNode> jxNodes2 = jxDocument.selN("//student/name");
 for (JXNode jxNode : jxNodes2) {
		System.out.println(jxNode);
}
	//4.3查询student标签下带有id属性的name标签
List<JXNode> jxNodes3 = jxDocument.selN("//student/name[@id]");
for (JXNode jxNode : jxNodes3) {
		System.out.println(jxNode);
}
			       
	//4.4查询student标签下带有id属性的name标签 并且id属性值为1
List<JXNode> jxNodes4 = jxDocument.selN("//student/name[@id='1']");
for (JXNode jxNode : jxNodes4) {
	  System.out.println(jxNode);
}

三、测试用的 student.xml 文件

<?xml version='1.0' encoding="UTF-8"?>
<students>
    <student>
        <name id='1'>zhang san</name>
        <age>23</age>
        <gender>male</gender>
        <br/>
    </student>
    <student>
        <name  id='2'>lisi</name>
        <age>24</age>
        <gender>female</gender>
        <br/>
    </student>
</students>
发布了647 篇原创文章 · 获赞 285 · 访问量 26万+

猜你喜欢

转载自blog.csdn.net/nanhuaibeian/article/details/104681978