爬取图片实例python爬虫（保存到本地） - 代码天地

爬取图片实例python爬虫（保存到本地）

移动开发 2023-05-07 22:46:08 阅读次数: 0

#导入请求、报错模块&正则表达式类库;

import urllib

import requests

import re

key_name = "python"

#定义函数，将爬到的每一页的商品url写入到文件;

 url = "https://search.jd.com/Search?keyword=" + key_name +"&enc=utf-8"

print(url)

 # 拿到每页源码;

// headers = {"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.90 Safari/537.36"}

data1 = requests.get(url,headers =headers).content.decode()

 #定义匹配规则';

 pat = 'src="//(.*?).jpg"'

#匹配到的所有图片url;

img_url = re.compile(pat).findall(data1)

print(img_url)

print(len(img_url))

 #内层for循环将所有图片写到本地；

for a_i in range(0,len(img_url)):

    this_img = img_url[a_i]

    this_img_url = "http://"+this_img + ".jpg"

    #每张图片的url

    print(this_img_url)

    

    img_path = "./imagetb" + str(a_i)+".jpg"

    urllib.request.urlretrieve(this_img_url,img_path)  # 通过urllib.request.urlretrieve()将对应链接的图片保存到本地

完整代码

#导入请求、报错模块&正则表达式类库
import urllib
import requests
import re
key_name = "python"
#定义函数，将爬到的每一页的商品url写入到文件
url = "https://search.jd.com/Search?keyword=" + key_name +"&enc=utf-8"
print(url)
# 拿到每页源码
headers = {
    
    "User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.90 Safari/537.36"}
data1 = requests.get(url,headers =headers).content.decode()

#定义匹配规则
pat = 'src="//(.*?).jpg"'
#匹配到的所有图片url
img_url = re.compile(pat).findall(data1)
print(img_url)
print(len(img_url))

# #内层for循环将所有图片写到本地
for a_i in range(0,len(img_url)):
    this_img = img_url[a_i]
    this_img_url = "http://"+this_img + ".jpg"
    #每张图片的url
    print(this_img_url)
    
    img_path = "./imagetb" + str(a_i)+".jpg"
    urllib.request.urlretrieve(this_img_url,img_path)  # 通过urllib.request.urlretrieve()将对应链接的图片保存到本地

亲测可用

猜你喜欢

转载自blog.csdn.net/weixin_45793937/article/details/105727887

爬取图片实例python爬虫（保存到本地）

python爬虫爬取图片并保存到本地

python爬虫爬取图片保存到本地文件

python爬虫实例练习：批量爬取头像图片并保存到磁盘

python爬取网站上的图片并保存到本地

python爬取网页图片并保存到本地

爬取图片并保存到本地

Python爬虫：爬取某鱼颜值主播图片并保存到本地升级版！

python爬虫爬取网站图片保存本地

scrapy爬虫系列之三--爬取图片保存到本地

node.js 爬虫实现爬取网页图片并保存到本地

python爬虫解析图片保存到本地

【Python】- scrapy 爬取图片保存到本地、且返回保存路径

爬虫实践小例子爬取书籍保存到本地

爬虫爬取《全职法师》并保存到本地

scrapy框架爬取图片保存到本地或mongodb的写法

单页图片爬取--并保存到本地

将csdn的文章爬取，并将图片保存到本地

使用原生php爬取图片并保存到本地

Paython爬取网页所有图片并保存到本地

利用Jsoup爬取网站的图片，保存到本地

Python：scrapy框架爬取校花网男神图片保存到本地

Python爬虫之selenium爬取英雄联盟官网英雄全皮肤图片下载到本地和保存到MongoDB数据库

使用Python爬取性感美女并保存到本地

python爬取网站视频保存到本地

Python爬虫之路-爬取在线课程并保存到Excel

python 爬虫之爬取网站信息并保存到文件

Python保存爬虫爬取的图片

Python爬虫自动爬取图片并保存

Java 爬取网页并保存到本地

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

更多

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)