用python抓取网页的图片 - 代码天地

用python抓取网页的图片

其他 2020-05-14 13:14:52 阅读次数: 0

python抓取数据

想要做数据分析师就要知道如何将网页上的数据获取。
比如我要去获取http://pic.netbian.com/4kdongman/index_2.html这个网页里所有的图片。

首先电脑里应该先有安装python和配置好python的环境变量。
然后我要先建一个文件夹，用来存我抓取到的图片，这个文件夹要建在和我要写python代码的py文件同一个目录里。

在这里插入图片描述

然后将代码写到我建好的getimages.py中并保存。

 #导入模块
import requests

#找网址
url='http://pic.netbian.com/4kdongman/index_2.html'

res =requests.get(url)

res.encoding='gbk'

from bs4 import BeautifulSoup

html=BeautifulSoup(res.text,'html.parser')

#检查 找到图片所在的列表，并找到列表的类名
parent=html.find('ul',class_='clearfix')
#找到列表中的图片
images=parent.find_all('img')

from urllib import request
for each in images:
    #找到图片的网址
    img_url='http://pic.netbian.com'+each.attrs['src']
    #print(img_url)
    name=each.attrs['alt']
    #print(name)
    #将图片存到images文件夹中
    request.urlretrieve(img_url,f'imagess/{name}.jpg')

然后在这个目录顶端输入cmd进入到运行窗口。
然后再运行窗口里写入 python getimages.py 然后回车,这样我就把这个网页的图片扣下来存到我的imagess文件夹中了。

如果要抓多页的数据的话就在 import requests（导入模块）和找网址之间加个循环（注意循环以下代码全都要tab或四个空格缩进一下）↓↓↓

#要抓取的页数
all=15
#从第一页开始循环，一直到第十五页
for pageNum in range(1,all+1):

然后在要抓取的网页链接的.html前面的数字改成{pageNum}
这样就可以疯狂的抓取到了15页的所有图片啦！

@machi

原创文章 8 获赞 27 访问量 2365

关注私信

猜你喜欢

转载自blog.csdn.net/lmachi/article/details/106051849

用python抓取网页的图片

用python抓取图片代码

python(二)：用python抓取指定网页

使用python实现简单网页图片抓取

Python爬虫之网页图片抓取

python爬虫-- 抓取网页、图片、文章

Python3 抓取网页中的图片

用Python抓取网页HTML文档

用nodejs库cheerio抓取网页内容与图片

java 抓取网页图片

爬虫抓取网页图片

python爬虫之抓取网页中的图片到本地

Python之多线程爬虫抓取网页图片

python尝试动态网页抓取图片，并保存

Python爬虫学习笔记一：简单网页图片抓取

Python3简单爬虫抓取网页图片

Python实现简单网页图片抓取完整代码实例

Python多线程抓取网页图片地址

怎么用Python写爬虫抓取网页数据

怎么用Python写爬虫抓取网页数据！

Python抓取网页内容

python网页信息抓取

python 抓取网页元素

爬虫-简单抓取网页图片

抓取网页上的图片(一)

python3爬虫(三)--抓取单个网页的文章标题以及其链接和抓取单个网页图片

实验：用Unity抓取指定url网页中的所有图片并下载保存

Python抓取图片

python_抓取网页视频

python 网页抓取信息

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)