从html富文本中提取纯文本

其他 2019-08-10 00:38:05 阅读次数: 0

其实从html富文本中提取纯文本很简单，富文本基本上是使用html标签给文本加上丰富多彩的样式。

所以只需要将富文本字符串中的“<.....>”标签剔除，即可得到纯文本。我们可以使用正则表达式，来匹配所有的html标签，并替换成空字符，如下：

//html剔除富文本标签，留下纯文本
function getSimpleText(html){
var re1 = new RegExp("<.+?>","g");//匹配html标签的正则表达式，"g"是搜索匹配多个符合的内容
var msg = html.replace(re1,'');//执行替换成空字符
return msg;
}

java：

str = str.replaceAll("<.+?>", "");

------------------------------------

原文地址：

https://blog.csdn.net/fengxi__/article/details/79297773

猜你喜欢

转载自www.cnblogs.com/commissar-Xia/p/11330168.html

从html富文本中提取纯文本

Java实现从Html文本中提取纯文本

html _ 提取html片段内的纯文本

图像中提取文本

C# 富文本(html、Markdown)转纯文本

从富文本获取纯文本

富文本和纯文本

从文本中提取图片路径（java 解析富文本处理 img 标签）

java从pdf中提取文本

从文本中提取特定信息

【Python】从文本中提取数字

PHP提取富文本字符串中的纯文本,并进行进行截取

浅谈纯文本&&富文本&&Markdown区别

HTMLParser 解析html字符串，提取纯文本

C#从PDF文档中提取文本

利用pyltp从文本中提取时间信息

使用python提取富文本中纯字符串内容

富文本，v-html

php 纯文本输出html

HtmlParser提取网页中的纯文本信息

UEditor 使用获取纯文本/格式纯文本/html内容

富文本

cut 从文本中提取一段文字并输出

python从pdf文件中提取文本，并自动翻译

一种精确从文本中提取URL的思路及实现

ChemDataExtractor:从PDF、HTM、文本等中提取化学数据

如何用Python从PDF文件中提取文本词汇

从文本中提取身份证号码

从规则文本文件中提取列字段

基于C＃从PDF文档中提取文本

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)