基础爬虫-----正则表达式(原子介绍) - 代码天地

基础爬虫-----正则表达式(原子介绍)

其他 2020-02-18 10:22:48 阅读次数: 0

原子：是正则表达式最基本的组成单位，每个正则表达式中至少要包含一个原子，常见的类型：

① 普通字符

②非打印字符

③通用字符

④原子表

①的案例代码：

# 正则表达式需要导入的模块
import re
# 普通字符作为原子
string = "taoyunjiaoyu"
# 想要提取的内容：
data = "yun"
# 使用正则表达式里的函数
ret = re.search(data,string)
print(ret)

①的运行结果：

②的案例代码：

# 非打印字符作为原子
# 非打印字符：像\n(换行符)  \t(制表符)等（存在\n）
string = '''taoyunjiaoyu
baidu
'''
data = "\n"
ret =re.search(data,string)
print(ret)

②的运行结果：

②的案例代码2（如果不存在\n会怎么样）

# 非打印字符作为原子
# 非打印字符：像\n(换行符)  \t(制表符)等
string = '''taoyunjiaoyubaidu'''
data = "\n"
ret =re.search(data,string)
print(ret)

②的案例代码2（如果不存在\n会怎么样）的运行结果-----None

③的案例代码：

# 通用字符可以作为原子：
# \w 字母、数字、下划线
# \W 除字母、数字、下划线
# \d 十进制数字
# \D 除十进制数字
# \s 空白字符
# \S 除空白字符
string = '''taoyunj i51468525aoyubaidu'''
# 几个\d几个数字
data = "\s\w\d\d\d"
ret =re.search(data,string)
print(ret)

③的运行结果：

④的案例代码：

# 原子表：
#[xyz]提取原子表其中一个元素 如果在原子表中出现^即非的意思（[^abc]）
string = "taoyunj i51468525aoyubaidu"
# 几个\d几个数字
data = "tao[xyz]un"
data1= "tao[yun]"
ret =re.search(data,string)
ret1=re.search(data1,string)
print(ret,ret1)
# print(ret1)

④的运行结果：

发布了98 篇原创文章 · 获赞 34 · 访问量 3万+

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_42133768/article/details/96473087

基础爬虫-----正则表达式(原子介绍)

正则表达式基础：原子

正则表达式实战：原子

基础爬虫-----正则表达式(元字符和模式修正符介绍)

爬虫之正则表达式基础篇

正则表达式基础——以Python爬虫为实例

【零基础学爬虫】正则表达式

爬虫-正则表达式的基础操作

# 正则表达式 -- re模块爬虫基础 # 15

python爬虫正则表达式基础

爬虫基础（二）正则表达式

【re正则表达式】------- PYTHON爬虫基础1

Python爬虫基础+正则表达式

java正则表达式（基础介绍及简单应用）

Python网络爬虫：爬虫原理、正则表达式、正则表达式函数、urllib基础、超时设置

爬虫之正则表达式

Python 爬虫_正则表达式

Python爬虫（正则表达式）

Python爬虫--正则表达式

爬虫：正则表达式

Python爬虫与正则表达式

网络爬虫的正则表达式

python爬虫正则表达式

python爬虫——正则表达式

【python爬虫】正则表达式

爬虫（六）正则表达式

正则表达式爬虫1

爬虫入门_正则表达式

爬虫（7）——正则表达式

爬虫&正则表达式学习

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)