python正则表达式提取/过滤字符串中的数字

其他 2021-03-19 05:10:44 阅读次数: 0

文章目录

背景
思路
code

背景

训练文本分类模型需要对文本中的数字、特殊符号预处理

思路

1 既然是提取数字，那么数字的形式一般是：整数，小数，整数加小数；

2 所以一般是形如：----.-----；

3 根据上述正则表达式的含义，可写出如下的表达式："\d+.?\d*"；

4 \d+匹配1次或者多次数字，注意这里不要写成*，因为即便是小数，小数点之前也得有一个数字；.?这个是匹配小数点的，可能有，也可能没有；\d*这个是匹配小数点之后的数字的，所以是0个或者多个

code

# -*- coding: cp936 -*-
import re
 
string="A1.45，b5，6.45，8.82"
print(re.findall(r"\d+\.?\d*",string))  # 查找
# ['1.45', '5', '6.45', '8.82']
res = re.sub(r"\d+\.?\d*", "", string)  # 过滤

其他类似：
如过滤中英文标点和特殊符号
过滤换行符等特俗符号

# 替换 空格 \t \r \n
import re
 
str1='123  456  7\t8\r9\n10'
str1 = re.sub('[\s+]', '', str1)
print(str1)

猜你喜欢

转载自blog.csdn.net/m0_38024592/article/details/113667274

python正则表达式提取/过滤字符串中的数字

Python:利用正则表达式从字符串提取数字

python 从字符串中提取数字，使用正则表达式

oracle利用正则表达式提取字符串中的数字

正则表达式-字符串提取数字表达式

JS 提取字符串中的数字正则表达式去除非数字字符

python正则表达式03--字符串中匹配数字

python 正则表达式找出字符串中的纯数字

正则表达式匹配字符串中的数字 Python

python使用正则表达式删除字符串中的数字

Java通过正则表达式提取数字串或者字符串

php 正则表达式字符串中提取带小数点的数字

Java编程中使用正则表达式过滤非数字字符串

Java正则表达式系列--从字符串中提取字符串或数字

用python正则表达式提取字符串

Python中提取指定字符串取出中间文本正则表达式

python如何用正则表达式提取字符串

Qt技巧：正则表达式提取字符串中的键值对数据

pandas中DataFrame字符串过滤之正则表达式

python正则表达式翻转字符串

python 正则表达式与字符串匹配

PHP中字符串与正则表达式

正则表达式：匹配字符串中的';'

字符串（4）：正则表达式（中）

C#从字符串中提取所有的数字并获得数字个数（正则表达式）

架构师之正则表达式(四)---------------从字符串中提取一串数字.

字符串中找出连续最长的数字串（正则表达式）

使用正则表达式来获取String字符串中的文字与数字

JavaScript 正则表达式：字符串中查找数字

【java后端】java通过正则表达式去掉字符串中数字

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)