Python之数据采集(No.2) - 代码天地

Python之数据采集(No.2)

其他 2019-05-12 10:01:13 阅读次数: 0

正则表达式常用符号

“*"匹配前面的字符，子表达式或者括号里的字符0次或者多次
”+“匹配前面的字符，表达式或者括号里的字符至少1次
”[]“匹配任意一个字符
”()“表达式编组，表达式里编组的优先进行运算
”{m,n}"匹配前面的字符，子表达式或括号里的字符m到n次（包含m或n）
[^]匹配任意一个不在中括号里的字符
“|”匹配任意一个由竖线分割的字符，子表达式
“.“匹配任意单个字符
”^“指字符串开始位置的字符或者子表达式
”\“转义字符
”$“从末尾开始匹配

例子：

from urllib.request import urlopen
from bs4 import BeautifulSoup
import re   //引入正则表达式
html=urlopen("http://www.pythonscraping.com/pages/page3.html")
bsObj=BeautifulSoup(html)      
images=bsObj.findAll("img",{"src":re.compile("\.\.\/img\/gifts\/img.*\.jpg")})   ///转义字符
for image in images:
    print(image["src"])

Lambda表达式

soup.findAll(lambda tag:len(tag.attrs)==2)
<div class="body" id="content"></div>
<span style="color:red" class="title"></span>

猜你喜欢

转载自blog.csdn.net/weixin_42578658/article/details/90045017

Python之数据采集(No.2)

Python日记(NO.2)

Python图书之《Python网络数据采集》

python数据采集2-HTML解析

《python网络数据采集》笔记2

Python之数据采集(No.1)

python学习之爬虫网络数据采集

python3+Pytest 接口自动化测试全方案设计与开发-No.2接口自动化框架编写-8-数据驱动之excel数据驱动

python3+Pytest 接口自动化测试全方案设计与开发-No.2接口自动化框架编写-7-数据驱动之yaml数据驱动

python opencv入门（学习笔记no.2）-视频的读入读出

NO.2 Python读入图片并灰度显示并保存退出

leetcode No.2 两数相加 (python3实现)

[NumPy 学习笔记] - No.2 NumPy数据索引

力扣——数据库刷题 No.2

Python网络数据采集（2）——复杂HTML解析（2）

2018.8.25 No.2

小记 no.2

Java学习NO.2

论文分享NO.2

组合（递归no.2）

No.2 Linux基础

No.2 JSX 简介

NO.2随笔

Oracle(No.2)

选择结构（no.2）

Linux(No.2)

机器学习No.2

约瑟夫问题No.2

【TouchDesigner笔记】NO.2

【Arduino笔记】NO.2

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)