【Python爬虫】下载微信公众号图片 - 代码天地

【Python爬虫】下载微信公众号图片

编程语言 2018-10-09 05:49:32 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/sinat_37967865/article/details/82957894

大家用爬虫下载图片时肯定遇到过https://demo?wx_fmt=jpeg链接的图片，常见的就是微信公众号的图片。
遇到链接图片用普通的方式是无法爬取下来的，我们可以用urllib.request进行简单爬取，具体源码如下：

# 2018年10月07日 13点30分
# 作者：cacho_37967865
# 爬虫：抓取微信公众号图片
# 示例网址：https://mp.weixin.qq.com/s/2Bi__FPfSMSli0pw6GtSAQ


from re import findall
from urllib.request import urlopen
import os

url = 'https://mp.weixin.qq.com/s/2Bi__FPfSMSli0pw6GtSAQ'
image_path = './Wechatimg'
os.chdir(image_path)

# bytes->str：decode 解码
with urlopen(url) as fp:
    content = fp.read().decode()   # 需要进行解码成字符串
print(content)                     # 得到的是默认的utf-8格式字符串

pattern = 'data-type="jpeg" data-src="(.+?)"'
result = findall(pattern, content)
print(result)                      # 得到的是一个列表

for index, item in enumerate(result,1):
    data = urlopen(str(item)).read()
    print('开始下载第' + str(index) +'张图片：'+ str(item))
    f = open(str(index) + '.jpg', "wb")
    f.write(data)
    f.close()

从源码中可以看到两个特殊的函数decode()和enumerate()
1. decode()方法使用编码注册的编解码器解码该字符串。它默认是使用系统默认的字符串编码。
str->bytes：encode 编码
bytes->str：decode 解码
bytes.decode(encoding="utf-8", errors="strict")
str.encode(encoding="utf-8", errors="strict")
编码就是将字符串转换成字节码，涉及到字符串的内部表示。
解码就是将字节码转换为字符串，将比特位显示成字符。

2. enumerate() 函数用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列，同时列出数据和数据下标，一般用在 for 循环当中。
用法
enumerate(sequence, [start=0])
参数
sequence -- 一个序列、迭代器或其他支持迭代对象。
start -- 下标起始位置，默认没有时以0开始

猜你喜欢

转载自blog.csdn.net/sinat_37967865/article/details/82957894

【Python爬虫】下载微信公众号图片

Python爬虫实现微信公众号文章批量下载

Python爬虫实现的微信公众号文章下载器

Python 爬虫之微信公众号

微信公众号爬虫

Python爬虫五：微信公众号爬虫（2018.9.8）

微信公众号里的图片下载并显示

python_爬虫_微信公众号抓取

【爬虫】python爬取微信公众号文章

Python 爬虫实战案例 : 微信公众号的爬取

python微信公众号文章爬虫（上）

python 微信公众号开发 django 实现上传图片

python抓取微信公众号新闻文章图片

python下载微信公众号相关文章

教你如何入手用python实现简单爬虫微信公众号并下载视频

爬虫-requests,微信公众号推送

PHP微信公众号文章爬虫

微信公众号爬虫项目

GitHub 微信公众号爬虫推荐

GitHub 微信公众号爬虫推荐

微信公众号爬虫项目（reptile）

微信公众号自动回复图片

微信公众号图片上传

微信公众号回复图片

微信公众号图片爬取

微信公众号中的视频下载

怎样下载微信公众号封面图片、视频、音频资源？

小技巧！无需插件，一键批量下载微信公众号的图片！

下载微信公众号文章里所有的图片（支持多线程）

微信公众号里的文章图片应该如何原图下载

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)