Jsoup使用DOM方法来遍历一个文档 - 代码天地

Jsoup使用DOM方法来遍历一个文档

其他 2018-09-10 02:08:52 阅读次数: 0

版权声明：欢迎转载,但请注明出处 https://blog.csdn.net/itguangit/article/details/80991799

官方文档: http://www.open-open.com/jsoup/

问题

你有一个HTML文档要从中提取数据，并了解这个HTML文档的结构。

方法

将HTML解析成一个Document之后，就可以使用类似于DOM的方法进行操作。示例代码：

File input = new File("/tmp/input.html");
Document doc = Jsoup.parse(input, "UTF-8", "http://example.com/");

Element content = doc.getElementById("content");
Elements links = content.getElementsByTag("a");
for (Element link : links) {
  String linkHref = link.attr("href");
  String linkText = link.text();
}

说明:

Elements这个对象提供了一系列类似于DOM的方法来查找元素，抽取并处理其中的数据。具体如下：

查找元素:

getElementById(String id)
getElementsByTag(String tag)
getElementsByClass(String className)
getElementsByAttribute(String key) (and related methods)
Element siblings: siblingElements(), firstElementSibling(), lastElementSibling(); nextElementSibling(), previousElementSibling()
Graph: parent(), children(), child(int index)

元素数据

attr(String key)获取属性attr(String key, String value)设置属性
attributes()获取所有属性
id(), className() and classNames()
text()获取文本内容text(String value) 设置文本内容
html()获取元素内HTMLhtml(String value)设置元素内的HTML内容
outerHtml()获取元素外HTML内容
data()获取数据内容（例如：script和style标签)
tag() and tagName()

操作HTML和文本

append(String html), prepend(String html)
appendText(String text), prependText(String text)
appendElement(String tagName), prependElement(String tagName)
html(String value)

猜你喜欢

转载自blog.csdn.net/itguangit/article/details/80991799

Jsoup使用DOM方法来遍历一个文档

使用DOM方法来遍历一个文档

Use DOM methods to navigate a document(使用DOM方法来操纵文档)

jsoup解析和遍历一个html文档详解

【使用JSOUP实现网络爬虫】入门：解析和遍历一个HTML文档

自动刷新实例_使用setIntHeader()方法和setRefreshHeader()方法来模拟一个数字时钟

在JavaScript中，要判断一个值是否与数组中的对象的特定属性值相等，你可以使用Array.some()方法来遍历数组，并在每次迭代中进行判断。

【转】给定两个数组，写一个方法来计算它们的交集。

【使用JSOUP实现网络爬虫】从一个文件加载一个文档

在JavaScript中，你可以使用一些方法来判断一个值是否与数组或对象中的某个值相等。对于数组，你可以使用Array.includes()方法或Array.indexOf()方法来判断一个值是否

如何通过跟踪一个客户端程序发出的sql的方法来优化SQL

浏览器地址输入一个域名发生了什么(用类比的方法来理解)

手工实现一个字符串内容替换方法来替换replace

一个赚钱的好方法来钱道

MongoDB 使用 update() 和 save() 方法来更新集合中的文档

PHP DOM操作xml文档，删除一个，遍历删除所有(注意有陷阱)

遍历一个DOM树

用一个大集合存入20个随机数字，然后筛选其中的偶数元素，放到小集合当中。要求使用自定义的方法来实现筛选。

通过实现25个数组方法来理解及高效使用数组方法（）

通过实现25个数组方法来理解及高效使用数组方法

Java的File类的delete（）方法删除文件，Java中File类的isFile（）方法来检查某个值是不是一个文件

JAVA用最简单的方法来构建一个高可用的服务端，提升系统可用性

经典笔试题：有一个学生集合要求按照学生的身高从低到高排序（根据Collections.sort重载方法来实现）

STM32通过sram启动方法来运行一个flash解锁程序，程序运行后就可以将板子恢复

Obtain the max value in array using recursive method (用递归调用的方法来求一个数组元素的最大值)

【微信小程序】通过调用 wx.navigateBack() 方法来退出当前界面并返回上一个界面

Jsoup从一个文件加载一个文档

Java爬虫：Jsoup利用dom方法遍历Document对象

请用 JS 写出一个遍历 DOM 节点树的方法

使用ioc创建对象的方式之一(通过无参的构造方法来创建：)

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)