Python爬虫---爬取网络上的图片 - 代码天地

Python爬虫---爬取网络上的图片

其他 2018-10-05 22:09:49 阅读次数: 0

Python爬虫---爬取网络上的图片

什么是爬虫这个在这里就不多说了（毕竟有度娘），那么如何爬取网络上的图片呢？

这里以这个网站为例：http://www.ivsky.com/search.php?q=%E6%B5%B7&PageNo=10

1、打开网站后点右键--》查看网页源代码

然后是不是发现了一些规律呢如下面的图片格式大都是.jpg alt 是图片的描述对吧。

2、发现完这个规律那么我们就可以开始写代码啦（用正则表达式来表示这个规律然后把网页是地址传进去就ok啦）

import urllib.request
import re
import urllib
#根据给定的网址来获取网页详细信息，得到的html就是网页的源代码
def getHtml(url):
    page = urllib.request.urlopen(url)
    html = page.read()
    return html.decode('UTF-8')

def getImg(html):
    reg = r'src="(.+?\.jpg)" alt'
    imgre = re.compile(reg)
    imglist = imgre.findall(html)#表示在整个网页中过滤出所有图片的地址，放在imglist中
    x =0
    path = 'D:\\neg'
   # 将图片保存到D:\\test文件夹中，如果没有test文件夹则创建

    for imgurl in imglist:
        urllib.request.urlretrieve(imgurl,'{}{}.jpg'.format(path,x))  #打开imglist中保存的图片网址，并下载图片保存在本地，format格式化字符串
        x = x + 1
    return imglist
html = getHtml("http://www.ivsky.com/search.php?q=%E6%B5%B7&PageNo=9")#获取该网址网页详细信息，得到的html就是网页的源代码
print (getImg(html)) #从网页源代码中分析并下载保存图片
print("hello 123456")

这样就爬取到这个网站上的图片啦~~~~~~~

猜你喜欢

转载自blog.csdn.net/sm16111/article/details/82052605

Python爬虫---爬取网络上的图片

python网络爬虫，爬取图片信息

Python——网络爬虫（爬取网页图片）

Python爬虫爬取网页上的所有图片

python爬虫－爬取图片

python爬虫爬取图片

Python爬虫：爬取图片

python爬虫 - 爬取图片

【python爬虫】—图片爬取

干货必看 | Python爬虫爬取网络图片

网络爬虫之爬取图片

我的网络爬虫，nodejs图片爬取

Python编程（一）--爬虫爬取图片

Python爬虫——爬取网站的图片

Python爬虫爬取相关图片

python爬虫的图片信息爬取

Python爬虫之——爬取妹子图片

python爬虫-爬取网站图片。

Python 爬虫 ——爬取Web页面图片

python爬虫-简单的图片爬取实现

python爬虫之爬取图片

python爬虫-爬取美女图片

Python爬虫爬取网站上的图片

Python保存爬虫爬取的图片

Python爬虫爬取Google图片

爬取图片的python小爬虫

Python 爬虫爬取煎蛋网图片

Python爬虫入门——爬取网页图片

python爬虫爬取网站图片

python爬虫之爬取网站图片

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)