使用python提取富文本中纯字符串内容 - 代码天地

使用python提取富文本中纯字符串内容

企业开发 2023-09-16 19:34:42 阅读次数: 0

话不多说，直接上代码

import html
import re
import emoji

content = "你的富文本字符串"
htmlContent = html.unescape(content)
regex = r'\>.*?\<'
listAll = re.findall(regex, htmlContent)
listToSave = [i[1:-1] for i in listAll if i != '><' and len(i) > 2]
strContent = '\n'.join(listToSave)
# 过滤掉表情
strContent = filter_emoji(strContent)
if strContent != "":
    listRichTestInfo.append((ticketId, fieldKey, '', strContent))

filter_emoji 函数的实现方式，为了把表情字符替换为空

# filter_emoji 函数的实现方式，为了把表情字符替换为空
def filter_emoji(desstr, restr=''):
    # 过滤表情
    try:
        co = re.compile(u'[\U00010000-\U0010ffff]')
    except re.error:
        co = re.compile(u'[\uD800-\uDBFF][\uDC00-\uDFFF]')
    return co.sub(restr, desstr)

其实代码就这么多，欢迎大家来沟通交流

猜你喜欢

转载自blog.csdn.net/qq_33191599/article/details/126988562

使用python提取富文本中纯字符串内容

PHP提取富文本字符串中的纯文本,并进行进行截取

PHP开发小技巧①⑥—提取富文本字符串中的文本内容

提取python字符串括号中的内容

HTMLParser 解析html字符串，提取纯文本

Python使用re模块正则提取字符串中括号内的内容示例

python之re提取字符串中括号内的内容

python从字符串中提取指定的内容

python提取字符串之间的内容

提取字符串中的指定内容

C语言提取字符串中的内容

从html富文本中提取纯文本

python中使用[]提取字符(字符串)

提取json字符串的内容（框架）

NSString如何获取字符串中的数字 NSAttributedString如何计算富文本字符串的宽高

【数据处理】[python]提取某巨量文本中关键词及前N行字符串

Python使用re模块中的match匹配提取字符串

python 正则之提取字符串中的汉字

Python提取用户输入的字符串中的数字

Python提取某字符串中的特殊0

python matlotlib & 提取字符串中的中文

python提取字符串中的数字

Python 提取字符串中的数字

python提取字符串中的中文、数字、字母

如何利用python提取字符串中的数字

Python实现提取字符串中的数字功能

如何使用Python从字符串中提取数字？

使用正则，提取字符串中数字

使用gettext提取代码中的字符串配置

使用正则提取字符串中URL等信息

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)