Python网络爬虫实战：通过requests+bs4爬取并保存图片 - 代码天地

Python网络爬虫实战：通过requests+bs4爬取并保存图片

其他 2018-08-28 06:21:20 阅读次数: 0

Python爬虫实战基础篇——图片爬取

Python版本：3.5.4

涉及内容都是网络爬虫基础：requests和bs4库的应用、正则表达式等

import requests
import os
from bs4 import BeautifulSoup
import re

def GetHtml(url):#获取soup
    try:
        r = requests.get(url)
        demo = r.text
        soup = BeautifulSoup(demo, "html.parser")
        return soup
    except:
        return ""

def GetPic(url):#下载某一页的图片
    try:
        pic = requests.get(url)
        path = "爬取图片/图片page"+str(page)+".jpg"
        # 保存非文本类的图片、文件都可以用这个模板
        with open(path, 'wb') as f:
            f.write(pic.content)
        # 
            print("图片page"+str(page)+"爬取成功")
    except:
        print("page"+str(page)+"爬取失败")
 
# 获取页数
soup = GetHtml("http://www.zbjuran.com/mei/xinggan/201708/85005.html")
for x in soup.find(attrs = 'page').strings:
    pagestring = x
    break
pageend = re.sub("\D","",pagestring)

# 翻页爬取
page = 1
while page <= int(pageend):#不断访问网页的循环
    if page==1:
        url="http://www.zbjuran.com/mei/xinggan/201708/85005.html"
    else:
        url = "http://www.zbjuran.com/mei/xinggan/201708/85005_"+str(page)+".html"
    soup = GetHtml(url)
    img_src = soup.find('img').get('src')
    GetPic(img_src)
    page += 1

猜你喜欢

转载自blog.csdn.net/qq_29750277/article/details/78409521

Python网络爬虫实战：通过requests+bs4爬取并保存图片

Python网络爬虫requests、bs4爬取空姐图片，福利哦

Python网络爬虫requests、bs4爬取空姐网图片

爬取猎聘网职位(requests+bs4)

requests+bs4批量爬取反爬虫图片网站

python采用requests+bs4爬取豆瓣top250电影信息

python采用requests+bs4爬取豆瓣top250图书信息

python爬虫（requests+bs4的基本使用）

爬取三国演义全本内容，保存到TXT文件夹下（requests+bs4）

网络爬虫：Python+requests+bs4+xlwt 爬取京东商品存入Excel表

python采用requests+bs4爬取Gary个人博客学习页面并用mysql存储（https://www.gary666.com/learn）

requests实例4:图片的爬取与保存

03 Python爬虫之Requests网络爬取实战

爬虫2 requests+bs4爬汽车之家新闻, bs4的使用(遍历文档树和查找文档树), 搭一个免费的代理池, 验证码破解(超级鹰), 爬取糗事百科段子自动通过微信发给好友, 爬取(拉钩职位, cnblogs新闻, 红楼梦小说写入txt, 肯德基餐厅信息), 爬取博客园写入mysql

[Python 爬虫之路1] 爬取糗事百科（requests，bs4）

Python网络爬虫与信息提取（5）—— 实战之爬取网页图片并保存

python爬虫（五）：实战【2. 爬创客实验室（requests + bs4）】

爬虫--爬取网页图片--bs4

Python爬虫实战，requests模块，Python爬取音频数据并保存本地

Python爬虫实战，requests+openpyxl模块，爬取小说数据并保存txt文档（附源码）

Python保存爬虫爬取的图片

Python爬虫自动爬取图片并保存

python 爬虫--利用百度图片处理OCR识图API进行验证码识别，并通过python、requests进行网站信息爬取（二）实战

2019-11-11 爬网页3-爬取豆瓣电影信息保存到csv(python2.7，静态页面。requests/bs4/lxml/xpath）

python爬虫笔记（三）requests模块深入—网络图片的爬取和存储

Python爬虫之Requests库——网络图片的爬取和存储

Python爬虫学习（二）盗亦有道（三）Requests库网络爬取实战

Python爬虫入门——requests爬取单张图片/视频

python网络爬虫，爬取图片信息

Python——网络爬虫（爬取网页图片）

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)