使用python对图片进行爬取 - 代码天地

使用python对图片进行爬取

其他 2018-12-22 16:23:02 阅读次数: 0

对京东上面的手机图片进行爬取，f12找到相应的代码之后进行模式匹配，其中过滤到没用信息，实现代码如下：

import re
import urllib.request as request
import urllib

def craw(url, page):
    html1 = request.urlopen(url).read()
    html1 = str(html1)
    pat1 = '<div id="J_goodsList".+?<div class="page clearfix">'
    result1 = re.compile(pat1).findall(html1)
    result1 = result1[0]
    pat2 = '<img width="220" height="220" class="err-product" data-img="1" source-data-lazy-img=".+?\.jpg" />'
    imagelist = re.compile(pat2).findall(result1)
    x = 1
    for imageurl in imagelist:
        imagename = "F:\\C\\mobilepic\\" + str(page) + '-' + str(x) + '.jpg'
        #print(imageurl[87:-4]) 获得图片的地址
        imageurl = "http://" + imageurl[87:-4]
        try:
            request.urlretrieve(imageurl, filename=imagename)
            print(imagename)
        except urllib.error.URLError as e:
            #异常处理，若不能爬取，调至下一张图片
            if hasattr(e, 'code'):
                x = + 1
            if hasattr(e, 'reason'):
                x += 1
        x += 1


for i in range(1, 3):
    url = "https://search.jd.com/Search?keyword=%E6%89%8B%E6%9C%BA&enc=utf-8&qrst=1&rt=1&stop=1&vt=2&cid2=653&cid3=655&page=" + str(
        i) + '3&s=58&click=0'
    craw(url, i)
    print("Finish:", i)

结果：

下载图片 — 标题

猜你喜欢

转载自blog.csdn.net/qq_41359265/article/details/84672870

使用python对图片进行爬取

使用python对P站进行图片爬取

使用python爬取图片

python使用正则爬取图片

python使用多进程爬取图片

使用Python爬取网页图片

python如何使用request爬取图片

python使用scrapy爬取图片

Python爬取图片

Python爬虫对知乎问题下的图片进行爬取

Python 爬取网页图片并进行本地保存

Python根据关键字进行图片爬取

使用socket进行底层请求爬取图片

使用Firebug进行爬取

python爬取图片简记

Python爬取淘宝图片

Python爬取网页图片

[Python]简单的爬取图片

python爬虫－爬取图片

python爬虫爬取图片

Python爬取网站图片

python爬取豆瓣图片

Python爬取bing图片

Python爬取妹子图片

python爬取单张图片

【python】爬取搜索图片

【python】爬取网页图片

python 爬取 mzitu 图片

Python爬虫：爬取图片

python爬取京东图片

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)