Java 读取本地和在线 html文档 - 代码天地

Java 读取本地和在线 html文档

其他 2020-03-28 10:31:43 阅读次数: 0

由于业务需要，有时会需要读取一个html模板。

有这么一个需求：需要读取html文件的“body”内容，但是不想要这个body里面的某一个<h2> 元素，如果用正则表达式来进行匹配的话，会非常消耗性能。可以考虑使用这个方法

<!doctype html>
<html>
    <head>
      
        <meta http-equiv='Content-Type' content='text/html; charset=utf-8'>
        
        <title>helloWorld--zxk</title>
       
        <meta name='description' content=''>
     </head>
<body>
     <h2 class="rich_media_title" id="activity-name">
     <!-- 设置标题 -->
     #titleName#
     </h2>
     <div>
     </div>
     <h2>1111</h2>
 </body>
</html>

下面是Java代码

	public static String readTxtFileBodyDoc(String filePath) {
		StringBuilder sb = new StringBuilder();
		try {
			String encoding = "UTF-8";
//读取本地的html文件方法
			File file = new File(filePath);
			if (file.isFile() && file.exists()) { // 判断文件是否存在
				// 进行body元素提取
				Document document = null;
				document = Jsoup.parse(file, encoding);
				Element e = document.body();
				Element e1 = e.getElementById("activity-name");
//排除 某一个<h2>元素
				e1.remove();
				String eStr = String.valueOf(e);
				sb.append(eStr);
			}
            if (StringUtils.isEmpty(sb)) {
//读取线上的html文件地址
			try {
				Document doc = Jsoup.connect(filePath).get();
				Element e = doc.body();
				Element e1 = e.getElementById("activity-name");
				e1.remove();
				String eStr = String.valueOf(e);
				sb.append(eStr);

			} catch (Exception e) {
				
			}
			
		}
		} catch (Exception e) {
            e.printStackTrace();
        }
		String bodyCont = sb.toString();
        return bodyCont;
	}

李人

发布了67 篇原创文章 · 获赞 678 · 访问量 20万+

私信关注

猜你喜欢

转载自blog.csdn.net/qq_26465035/article/details/94617154

Java 读取本地和在线 html文档

java中使用freemaker将HTML导出到word文档，包括在线与本地的图片

Godot Engine：离线文档和在线文档

Java实现word文档在线预览，读取office文件

java ThumbnailAPI在线文档

Java读取doc文档

Java实现HTML代码生成PDF文档

JAVA实现HTML文档转PDF格式

【转载】java word文档转 html文件

java 通过html代码转换word文档

java word文档转 html文件

HTML中在线预览word文档

Three.js 中文文档和在线演示实例

java对word文档的在线打开

java在线打开PDF文档

java html字符串转html文档树(Java HTML Parser)

Java程序把Word文档直接转换成HTML文件

javascript+java实现html转化为PDF文档

Java读取本地文件

读取本地文件java

java 读取本地的图片

java 读取html过滤标签

java解析本地html文件

在线预览文档（支持word、excel、ppt、pdf）+在线预览文档html版(转)

[原创]java对word文档的在线打开

[转载]Java在线打开PDF文档

转 java对word文档的在线打开

Java jdk 在线文档（可搜索类）

Java在线打开编辑PPT文档

Java在线并发控制word文档

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)