图片懒加载 -- 爬虫

其他 2018-12-12 16:04:39 阅读次数: 0

图片懒加载

什么是图片懒加载?

　　图片懒加载是一种网页优化技术。图片作为一种网络资源，在被请求时也与普通静态资源一样，将占用网络资源，而一次性将整个页面的所有图片加载完，将大大增加页面的首屏加载时间。为了解决这种问题，通过前后端配合，使图片仅在浏览器当前视窗内出现时才加载该图片，达到减少首屏图片请求数的技术就被称为“图片懒加载”。

网站一般如何实现图片懒加载技术呢?

　　在网页源码中，在img标签中首先会使用一个“伪属性”（通常使用src2，original......）去存放真正的图片链接而并非是直接存放在src属性中。当图片出现到页面的可视化区域中，会动态将伪属性替换成src属性，完成图片的加载。

案例分析:

　　抓取站长素材http://sc.chinaz.com/中的图片数据,通过细致观察页面的结构后发现，网页中图片的链接是存储在了src2这个伪属性中

代码如下

import requests
from lxml import etree

url = 'http://sc.chinaz.com/tupian/gudianmeinvtupian.html'
headers = {
    'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36',
}
# 获取页面文本数据
response = requests.get(url=url, headers=headers)
response.encoding = 'utf-8'
page_text = response.text
# 解析页面数据（获取页面中的图片链接）
# 创建etree对象
tree = etree.HTML(page_text)
div_list = tree.xpath('//div[@id="container"]/div')
# 解析获取图片地址和图片的名称
for div in div_list:
    image_url = div.xpath('.//img/@src2')  # src2伪属性
    image_name = div.xpath('.//img/@alt')
    print(image_url)  # 打印图片链接
    print(image_name)  # 打印图片名称

猜你喜欢

转载自www.cnblogs.com/wj12312/p/10108786.html

图片懒加载 -- 爬虫

python爬虫--图片懒加载

爬虫--图片懒加载解决方案

爬虫-图片懒加载技术、selenium和PhantomJS

爬虫之图片懒加载技术、selenium和PhantomJS

Python爬虫之图片懒加载技术、selenium和PhantomJS

day05-python爬虫图片懒加载

爬虫学习 08.Python网络爬虫之图片懒加载技术、selenium和PhantomJS

08.Python网络爬虫之图片懒加载技术、selenium和PhantomJS 08.Python网络爬虫之图片懒加载技术、selenium和PhantomJS

Python网络爬虫之图片懒加载技术、selenium和PhantomJS

爬虫的验证码处理，图片懒加载，selenium和 PhantomJS，requests模块的session，线程池

爬虫之图片懒加载, selenium , phantomJs, 谷歌无头浏览器

懒加载问题，爬虫无法用src爬取图片问题

爬虫第二章 bs4 xpath 图片懒加载分页处理

爬虫之图片懒加载技术、selenium工具与PhantomJS无头浏览器

爬虫案例图片懒加载 qq空间模拟登录药监（selenium)

懒加载图片代码

JQ 图片的懒加载

JQ 图片懒加载

JS 图片懒加载

图片懒加载

实现图片懒加载

图片懒加载...

懒加载图片

jQuery的图片懒加载

jquery 图片懒加载

js：图片懒加载

JQ图片懒加载

Vue图片懒加载

图片懒加载技术

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)