python接口自动化测试十八：使用bs4框架爬取图片 - 代码天地

python接口自动化测试十八：使用bs4框架爬取图片

其他 2018-06-09 17:07:50 阅读次数: 7

# 爬图片
# 目标网站：http://699pic.com/sousuo-218808-13-1.html
import requests
from bs4 import BeautifulSoup
import os
r = requests.get('http://699pic.com/sousuo-218808-13-1.html')

# r.content   # 返回的是字节流

soup = BeautifulSoup(r.content, 'html.parser')  # 用html解析器，查找r.content

# tu = soup.find_all('img')   # 查找所有的标签名字为“img”的对象
tu = soup.find_all(class_="lazy")   # 查找所有的标签名字为“class_="lazy"”的对象


for i in tu:
#    print(i)
# <img alt="洱海清晨的彩霞倒映水中高清图片" class="lazy" data-original="http://img95.699pic.com/photo/50061/5608.jpg_wh300.jpg" height="300" src="http://static.699pic.com/images/blank.png" title="洱海清晨的彩霞倒映水中图片下载" width="453.30915684497"/>
    print(i['data-original'])   # 获取所有的url地址

# 爬单张图片
url = 'http://img95.699pic.com/photo/50061/5608.jpg_wh300.jpg'
r = requests.get(url)
f = open('123.jpg', 'wb')   # 以二进制写入的方式打开一个名为123.jpg的文件 （后缀可随意改）
f.write(r.content)  # 把r传输的字节流写入到文件中
f.close()   # 关闭文件



# 批量写入：

# 创建路径,  创建一个名为“tupian”的文件夹
curpath = os.path.dirname(os.path.dirname(os.path.realpath(__file__)))
tupian = os.path.join(curpath, 'tupian')
if not os.path.exists(tupian):  # 判断名字为“tupian”的文件夹是否为不存在
    os.mkdir(tupian)        # 不存在，则创建名字为“tupian”的文件夹
# 批量写入图片并保存
for i in tu:
    try:
        jpg_url = i['data-original']    # 要获取的图片的地址
        name = i['alt']
        r = requests.get(jpg_url)
        # 写入内容，放到tupian文件夹下
        f = open(os.path.join(tupian, '%s.jpg'%name), 'wb')
        f.write(r.content)
        f.close()
    except:
        pass

猜你喜欢

转载自www.cnblogs.com/zhongyehai/p/9160168.html

python接口自动化测试十八：使用bs4框架爬取图片

python接口自动化测试十七：使用bs4框架进行简单的爬虫

bs4爬取网站图片

python使用bs4爬取boss静态页面

Python使用bs4爬取 cnblogs

爬虫--爬取网页图片--bs4

python利用 request bs4 模块爬取imgur网站图片

Python网络爬虫requests、bs4爬取空姐图片，福利哦

Python网络爬虫requests、bs4爬取空姐网图片

python2使用bs4爬取腾讯社招

python爬虫系列(3.7-使用 bs4 爬取获取贵州农产品)

Python使用bs4爬取数据时乱码问题

python爬虫—使用bs4爬取链家网的房源信息

在python3中使用bs4模块爬取电影名称

bs4爬取网页基础

BS4爬取小说内容

python 简单爬取本地文档与爬取网页使用requests和bs4，及自己问题的解决

python超详细零基础 bs4解析之爬取唯美图片

爬虫之爬取图片（运用了bs4和正则查取）

python接口自动化测试 - unittest框架基本使用

python学习笔记（二十八）-- unittest 接口自动化测试框架

python接口自动化测试框架

python 接口自动化测试框架

网络爬虫 - 4 bs4的使用方法与爬取案例

Python 接口自动化测试框架 python_接口自动化测试框架

Python3-selenium\phantomjs\bs4爬取斗鱼页面

用xpath、bs4、re爬取B站python数据

利用python bs4爬取个人逾期数据

利用python bs4爬取企业逾期数据

[Python 爬虫之路1] 爬取糗事百科（requests，bs4）

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)