Python 正则表达式匹配中文

其他 2018-11-26 13:51:22 阅读次数: 0

在python2.x中，匹配中文，首先要声明utf8的编码方式。

# coding:utf-8

其次，被匹配的字符串一定要是utf8编码：

string = u'我是个好人。'

最后，正则表达式一定要是utf8编码：

pat = u'\u6211.*?\u3002'

注意，正则表达式要是u开头的utf8编码，而不是r开头的原始字符串。

完整示例：

# coding:utf-8

import re

string = u'我是个好人。'

pattern = u'\u6211.*?\u3002'

pat = re.compile(pattern)

print pat.findall(s)[0]

>>
我是个好人。

猜你喜欢

转载自www.cnblogs.com/wangyueyouyi/p/10019798.html

Python中正则表达式对中文的匹配问题

Python匹配中文的正则表达式

python正则表达式中文匹配

Python正则表达式匹配中文

Python 正则表达式匹配中文

python中文正则表达式匹配

Python 正则表达式匹配

通用正则表达式与python中的正则匹配

python正则表达式匹配出中文行政地名

python中正则表达式在中文字符串匹配时的坑

Python正则表达式---全部能匹配的子串迭代器finditer及findall及以中文匹配部分中文 Python正则表达式---全部能匹配的子串迭代器finditer及findall及以中文匹配部分中文

[Python]Python中使用正则表达式匹配

python正则表达式匹配时间与日期

python 正则表达式匹配数字练习记录

剑指offer：正则表达式匹配（Python）

Python 正则表达式匹配邮箱地址

python正则表达式匹配ip地址

【Leetcode】Python实现正则表达式匹配

python_正则表达式匹配ip

python 正则表达式匹配ip

Python正则表达式：最短匹配

python . 模式匹配与正则表达式

Python正则表达式匹配各种标准形式

python正则表达式匹配反斜杠

Python笔记26----正则表达式匹配

正则表达式在Python中的常用匹配字符

【python】正则表达式匹配多个模式

python之正则表达式：匹配邮箱

python爬虫的re库（正则表达式匹配）

Python_正则表达式匹配163邮箱

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)