Python爬虫——爬取京东手机图片实战 - 代码天地

Python爬虫——爬取京东手机图片实战

其他 2018-08-13 05:36:22 阅读次数: 0

Python爬虫——爬取京东手机图片实战

本文使用的版本为Python3，使用的IDE为Pycharm

请先在对应位置建立好文件夹（本示例为D:\JingDong\）

示例代码如下：

# 爬取京东手机图片

import re
from urllib import request

def craw(url, page):
    # 获取数据
    html1 = request.urlopen(url).read()
    # 转换为str
    html1 = str(html1)
    # 使用正则表达式
    pat1 = '<div id="plist".+? <div class="page clearfix">'
    result1 = re.compile(pat1).findall(html1)
    result1 = result1[0]
    pat2 = '<img width="220" height="220" data-img="1" data-lazy-img="//(.+?\.jpg)">'
    imagelist = re.compile(pat2).findall(result1)
    x = 1
    for imageurl in imagelist:
        imagename = 'D:\\JingDong\\' + str(page) + str(x) + '.jpg'
        imageurl = 'http://' + imageurl
        print(imageurl)
        try:
            request.urlretrieve(imageurl, filename=imagename)
        except request.HTTPError as e:
            print(e.code)
            print(e.reason)
        x += 1

# 爬取1，2两页
for i in range(1, 3):
    url = 'http://list.jd.com/list.html?cat=9987,653,655&page=' + str(i)
    craw(url, i)

猜你喜欢

转载自blog.csdn.net/m0_37770300/article/details/81276270

Python爬虫——爬取京东手机图片实战

京东手机评论的爬取

爬取京东手机排名

【Python3 爬虫】14_爬取淘宝上的手机图片

Python爬虫爬取手机APP的数据

爬虫_抓取京东手机图片

网络爬虫之java 爬取京东手机数据案例

Java 爬虫学习（三）关于京东手机信息爬取

Java爬虫入门（三）爬取京东上手机信息(Springboot)

爬取京东的手机类商品数据 | selenium | 爬虫详解

java爬虫案例——SpringBoot使用HttpClient、Jsoup爬取京东手机数据

Python爬虫实战，requests+openpyxl模块，爬取手机商品信息数据（附源码）

使用scrapy爬取京东的手机数据

爬取京东手机商品信息

Mitmdump手机端爬取京东商品详情

Java实现爬取京东手机数据

利用python爬虫爬取京东商城商品图片

超详细解析python爬虫爬取京东图片

python爬取京东图片

【Python爬虫案例学习】python爬取淘宝里的手机报价并以价格排序

Python爬虫实战（二）：抓取京东苹果手机评价

利用爬虫爬取 zol网站热门手机

GO爬虫-爬取手机号

Python爬虫之手机端微博数据爬取（十二）

爬虫练习一，爬取京东图片

Python爬虫实战：Scrapy爬取京东商品数据保存到Mysql且重命名下载商品图片

python-selenium自动爬取京东手机端全部类别数据----“从祖爬到孙”

Python 京东爬虫抢手机小程序

爬虫实战系列(八)：淘宝店铺各品牌手机售卖信息爬取及可视化

Python爬虫实战之爬取网站全部图片(一)

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)