爬虫_抓取京东手机图片 - 代码天地

爬虫_抓取京东手机图片

其他 2020-02-19 10:35:02 阅读次数: 0

#1.抓取网页html
#2,根据正则表达式爬去关键内容
#3.根据关键内容，再次使用正则匹配出图片地址
#4.存储图片

import urllib.request
import re
import urllib.error
def craw(url,page):
    html=urllib.request.urlopen(url).read()
    html=str(html)
    #先把所有图片部分的数据取出
    pat1='<div id="plist".+?<div class="clr">'
    result1=re.findall(pat1,html)
    if result1:
        result1=result1[0]
        #常加载正则
        pat2='<img width="220" height="220" data-img="1" src="//(.+?\.jpg)"'
        # 懒加载正则
        pat3='<img width="220" height="220" data-img="1" data-lazy-img="//(.+?.jpg)"'
        imagelist1=re.findall(pat2,result1)
        imagelist2=re.findall(pat3,result1)
        #将所有图片合并
        imagelist=imagelist1+imagelist2
        x=1
        for imageurl in imagelist:
            #对所存的图片进行命名
            imagename='jd/'+str(page)+str(x)+".jpg"
            #图片地址
            imageurl="http://"+imageurl
            try:
                #获取图片并保存
                urllib.request.urlretrieve(imageurl,filename=imagename)
            except urllib.error.HTTPError as e:
                #hasattr函数判断是否有这些属性
                if hasattr(e,"code"):
                    x += 1
                if hasattr(e,'reason'):
                    x += 1
            x+=1
        print('抓取成功')
    else:
        print('抓取失败，未获得内容')

#分页
for i in range(1,2):
    #url重构
    url='https://list.jd.com/list.html?cat=9987,653,655&page='+str(i)
    craw(url,i)

抓取成功

发布了76 篇原创文章 · 获赞 23 · 访问量 1万+

私信关注

猜你喜欢

转载自blog.csdn.net/qq_39309652/article/details/104366533

爬虫_抓取京东手机图片

Python爬虫——爬取京东手机图片实战

Python爬虫实战（二）：抓取京东苹果手机评价

Python抓取京东手机的配置信息

Python爬虫：抓取手机APP的数据

京东手机爬虫（仅供学习交流）

Python 京东爬虫抢手机小程序

SEO优化：如何抓取手机网站图片

使用selenium+BeautifulSoup 抓取京东商城手机信息

京东手机端

爬虫用fiddler抓取网易新闻客户端手机app内容

网络爬虫-模拟手机浏览器抓取数据

APP爬虫- 手机安装证书-设置fiddler抓取移动端数据包

Python3爬虫：利用Fidder抓取手机APP的数据

python3 爬虫实战：用 Appium 抓取手机 app 微信的数据

Python爬虫入门教程 29-100 手机APP数据抓取 pyspider

Python爬虫入门教程：手机APP数据抓取 pyspider

Python爬虫实战：抓取手机APP的数据分析

网络爬虫之java 爬取京东手机数据案例

Java 爬虫学习（三）关于京东手机信息爬取

爬取京东的手机类商品数据 | selenium | 爬虫详解

Java爬虫入门（三）爬取京东上手机信息(Springboot)

京东全网手机爬虫scrapy_redis及决策树数据分析

java爬虫案例——SpringBoot使用HttpClient、Jsoup爬取京东手机数据

手机抓取流量包

python抓取手机app教程

使用Fiddle抓取IOS手机

fiddler如何抓取手机包

手机号总被抓取？

网页手机号抓取

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

更多

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)