Python中正则表达式对中文的匹配问题

编程语言 2018-05-12 20:36:56 阅读次数: 2

http://blog.csdn.net/freedomqx/article/details/6237654

今天在用Python匹配中文的时候出了问题，要么匹配不到，要么乱码，搜索了一下，成功完成，写了一小段测试代码如下：

[python]view plain copy
       
   
import re  
source = "s2f程序员杂志一2d3程序员杂志二2d3程序员杂志三2d3程序员杂志四2d3"  
temp = source.decode('utf8')  
xx=u"([/u4e00-/u9fa5]+)"  
pattern = re.compile(xx)  
results =  pattern.findall(temp)  
for result in results :  
  print result  

其中source为非unicode编码，要先将其转为unicode编码的temp

然后写正则表达式xx，其中u的前缀表示正则表达式也要为unicode编码，因为正则表达式要和被匹配的文本使用同样编码

unicode中中文的编码为/u4e00-/u9fa5

调用匹配后直接便可打印出正确文字，此时返回的结果也为unicode编码

猜你喜欢

转载自smartblack.iteye.com/blog/2301949

Python中正则表达式对中文的匹配问题

python中正则表达式与模式匹配

Python中正则表达式与模式匹配！

python中正则表达式在中文字符串匹配时的坑

Python中正则表达式

C#中正则表达式的构建与匹配

java中正则表达式如何匹配竖线(|)

正则表达式匹配中文时发现的问题

Python匹配中文的正则表达式

python正则表达式中文匹配

Python正则表达式匹配中文

Python 正则表达式匹配中文

python中文正则表达式匹配

正则表达式匹配中文

中文正则表达式匹配-正则中文匹配

中文正则表达式匹配正则中文匹配

Python中正则表达式的一些匹配规则

Python中正则表达式 Python正则表达式指南

Python中正则表达式讲解

Python中正则表达式（re模块）的使用

Python中正则表达式的特殊字符

Python中正则表达式的详细用法

python中正则表达式re模块

python中正则表达式的使用

Python中正则表达式介绍

Python中正则表达式的巧妙使用 !

Python中正则表达式的巧妙使用

python中正则表达式基本使用

python中正则表达式的应用大全

python中正则表达式？(问号)的详解及用法

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)