补充：批量下载百度贴吧图片Demo - 代码天地

补充：批量下载百度贴吧图片Demo

其他 2019-03-16 19:10:54 阅读次数: 0

版权声明：本文为博主原创文章，注明出处，随意转载。 https://blog.csdn.net/IMW_MG/article/details/78594370

之前在我的一篇博客中写了一个爬虫小程序，是用于通过接收用户百度贴吧帖子网址输入，然后批量下载楼层图片的一个小爬虫【博客地址】。
实现特别简单，都是获取百度贴吧图片资源的url信息，不过这次换作用BS4模块来实现，下面写了一个小Demo。

# !/usr/bin/env python

from urllib.request import urlopen
from bs4 import BeautifulSoup
from urllib.request import urlretrieve

url = input('请输入贴吧贴子URL：')
html = urlopen(url)
bsObj = BeautifulSoup(html, 'lxml')

imgLinks = bsObj.find('cc').find_all('img', {'class': 'BDE_Image'})     # 百度贴吧所有楼层图片链接所在标签，返回带标签列表

x = 0
for item in imgLinks:
    x += 1
    print('Downloading... ==> [%d]' % x)
    print(item['src'])      
    urlretrieve(item['src'], filename=str(x) + '.jpg')  # 存储命名方式

运行结果如下

请输入贴吧贴子URL：>? https://tieba.baidu.com/p/5444626189
Downloading... ==> [1]
https://imgsa.baidu.com/forum/w%3D580/sign=5e23c902083b5bb5bed720f606d2d523/f61fdcc451da81cb4fcc4b645966d016082431e6.jpg
Downloading... ==> [2]
https://imgsa.baidu.com/forum/w%3D580/sign=01ce71cd9feef01f4d1418cdd0ff99e0/dca7267f9e2f07089d79e2a9e224b899a801f289.jpg
Downloading... ==> [3]
https://imgsa.baidu.com/forum/w%3D580/sign=bc7cfed673f0f736d8fe4c093a54b382/75aca2cc7cd98d1016f1c4982a3fb80e7aec90e7.jpg

猜你喜欢

转载自blog.csdn.net/IMW_MG/article/details/78594370

补充：批量下载百度贴吧图片Demo

Python实现简单爬虫功能--批量下载百度贴吧里的图片

百度贴吧所有图片怎么快速批量下载？

python 爬虫爬取百度贴吧图片 urllib.request.urlretrieve图片批量下载函数

python 爬取菜鸟教程python100题，百度贴吧图片反爬虫下载，批量下载

爬虫_百度贴吧图片

demo_urllib批量下载百度图片

百度贴吧获取某个吧的全部图片

批量获取百度贴吧娱乐明星的照片

百度贴吧

使用XPath的爬虫,百度贴吧图片下载

python爬取百度贴吧张国荣图片

python爬虫爬取百度贴吧图片

Python爬取百度贴吧图片

爬取百度贴吧图片

python爬取百度贴吧Jpg图片

简单爬虫，爬去百度贴吧图片

百度贴吧图片爬取

Scrapy 爬取百度贴吧全站图片

简单爬取百度贴吧图片

爬取百度贴吧图片（表情包）

百度贴吧帖子图片爬虫

爬虫实现百度贴吧的图片爬取

爬虫百度贴吧下载20页html

urllib批量下载百度图片

爬虫-百度贴吧

百度贴吧爬虫

卸载百度贴吧

[python]百度贴吧爬虫

百度贴吧体验报告

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)