Regular Express 匹配中文，所有中文标点符号 - 代码天地

Regular Express 匹配中文，所有中文标点符号

其他 2018-12-04 18:51:17 阅读次数: 0

import re

import requests

text=requests.get("https://movie.douban.com").text

#1.匹配汉字 \u4E00-\u9FA5

re.findall('[ \u4E00-\u9FA5]+',text)

#参考

https://www.qqxiuzi.cn/zh/hanzi-unicode-bianma.php

#2.匹配所有中文标点符号 [\u3002|\uff1f|\uff01|\uff0c|\u3001|\uff1b|\uff1a|\u201c|\u201d|\u2018|\u2019|\uff08|\uff09|\u300a|\u300b|\u3008|\u3009|\u3010|\u3011|\u300e|\u300f|\u300c|\u300d|\ufe43|\ufe44|\u3014|\u3015|\u2026|\u2014|\uff5e|\ufe4f|\uffe5]

re.findall('[\u3002|\uff1f|\uff01|\uff0c|\u3001|\uff1b|\uff1a|\u201c|\u201d|\u2018|\u2019|\uff08|\uff09|\u300a|\u300b|\u3008|\u3009|\u3010|\u3011|\u300e|\u300f|\u300c|\u300d|\ufe43|\ufe44|\u3014|\u3015|\u2026|\u2014|\uff5e|\ufe4f|\uffe5]',text)

#参考

https://blog.csdn.net/cysear/article/details/80435756

猜你喜欢

转载自www.cnblogs.com/wdxez/p/10065886.html

Regular Express 匹配中文，所有中文标点符号

【java】判断是否是中文或中文标点符号

utf-8 去掉中文标点符号

中文标点符号转英文标点符号全角转半角 String工具类

javascript学习笔记 - 英文标点符号替换成中文标点符号

python 去除所有的中文英文标点符号

无法输入中文标点符号问题解决方案【亲测有效】

Java 中文字符判断中文标点符号判断

正则表达式处理中文和中文标点符号

正则表达式去除中文标点符号并且获取数字

Python文本处理——中文标点符号处理

【转】Python3处理中文标点符号

Ubuntu英文版中无法输入中文标点符号的问题

Express 中文API 笔记

Regular Number HDU - 5972（快速匹配+setbit）

Linux下fcitx框架输入法输入中文标点时为半角（英文）标点符号的解决

Regex_中文字符和中文标点符号的正则表达式

中文的符号转成英文标点符号

Regular Regular Expression

Express

javascript判断一个字符串是否是中文字符串并且不含中文标点符号

10. Regular Expression Matching字符串.*匹配

Regular Number HDU - 5972 （字符串匹配+bitset妙用）

Regular Number HDU - 5972（巧妙的字符串匹配+bitset）

[LeetCode]正则表达式匹配（Regular Expression Matching）

LeetCode 10.Regular Expression Matching 正则匹配

C - Longest Regular Bracket Sequence(思维+括号匹配+dp)

express4.x中文文档

Nodejs Express 4.X 中文API

11 ~ express ~ 解决 cookie 中文报错的问题

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)