页面加载性能之感知真实世界

虽然我们可以通过开发者工具以及lighthouse等工具来查看网站的加载情况,并按之前我们说的那些方案做好了优化,但真正用户打开是否真的如预期一般快,我们不得而知。一直以来我们都以实验室数据为测试的依据,这些不能代表现场数据,即真实用户的体验。

RUM(Real User Monitoring)因此而诞生。RUM依赖于浏览器提供的API来搜集真实用户的性能数据,主要包含2个标准文档,Navigation Timing APIResource Timing API,这两个API都是基于 High Resolution Time 的规范定制的。

本文档将引导你去认识这些API提供的数据,更好的掌握RUM。

浏览器中的网络请求

Navigation和Resource Timing之间有部分交集,但两者收集的数据指标还是不一样的。

  • Navigation Timing 收集了HTML文档的性能指标
  • Resource Timing 收集了文档依赖的资源的性能指标,如:css,js,图片等等

先在控制台尝试执行一下以下代码:

// Get Navigation Timing entries:
performance.getEntriesByType("navigation");

// Get Resource Timing entries:
performance.getEntriesByType("resource");

getEntriesByType 接收一个字符串参数,表示你要获取的条目类型。想要获取Navigation Timing的条目,则传 navigation,另一个则是传 resource。以上代码执行结果,可以看到类似下方的对象结构:

{
  "connectEnd": 152.20000001136214,
  "connectStart": 85.00000007916242,
  "decodedBodySize": 1270,
  "domComplete": 377.90000007953495,
  "domContentLoadedEventEnd": 236.4000000525266,
  "domContentLoadedEventStart": 236.4000000525266,
  "domInteractive": 236.2999999895692,
  "domainLookupEnd": 85.00000007916242,
  "domainLookupStart": 64.4000000320375,
  "duration": 377.90000007953495,
  "encodedBodySize": 606,
  "entryType": "navigation",
  "fetchStart": 61.600000015459955,
  "initiatorType": "navigation",
  "loadEventEnd": 377.90000007953495,
  "loadEventStart": 377.90000007953495,
  "name": "https://example.com/",
  "nextHopProtocol": "h2",
  "redirectCount": 0,
  "redirectEnd": 0,
  "redirectStart": 0,
  "requestStart": 152.50000008381903,
  "responseEnd": 197.80000008177012,
  "responseStart": 170.00000004190952,
  "secureConnectionStart": 105.80000001937151,
  "startTime": 0,
  "transferSize": 789,
  "type": "navigate",
  "unloadEventEnd": 0,
  "unloadEventStart": 0,
  "workerStart": 0
}

上面的数据看起来很晕,但只要记住一点:你在开发者工具中 Network 看到的 waterflow ,就是用这些数据画出来的。你也可以用这些数据绘制类似的图,用一些工具就能做到,Waterfall 或者 Performance-Bookmarklet

用这些API可以分析用户打开一个网站的每一个步骤的耗时,你也可以在js中上去使用这些API来收集真实用户的性能数据。

网络请求的生命周期

在你收集完这些性能数据之后,为了更形象的去理解他们,你需要了解一个请求从发起到结束到底经历了什么,开发者工具可以提供这样的图表,如下:

如预期的一样,可以看到这些步骤:DNS查询,建立连接,TLS握手等等。接下来我们会对着这份数据依次去介绍它们。

以下纯属主观看法,想要客观地去学习,回到上方提供的对应API的标准文档阅读

DNS查询

DNS全称Domain Name System,简单理解就是根据域名查询对应的IP地址。取决于你中间的DNS代理层数,可能会花费一些时间。Navigation和Resource Timing都包含以下2个和DNS查询相关的属性:

  • domainLookupStart 代表DNS开始查询的时间
  • domainLookupEnd 代表DNS查询结束

很简单,做个减法,我们就能拿到DNS查询的耗时。

// Measuring DNS lookup time
var pageNav = performance.getEntriesByType("navigation")[0];
var dnsTime = pageNav.domainLookupEnd - pageNav.domainLookupStart;

要注意一点,这两个值可能都是 0,当我们的资源是非同源的时候,假设可能是用了第三方的CDN服务,且没有携带 Timing-Allow-Origin 的响应头。

建立连接

在与服务器建立连接之后,相关的资源才会发送到客户端。如果这个时候用了HTTPS协议,这个建立连接的过程就会多一步TLS握手。与此相关的3个指标如下:

  • connectStart 表示连接开始建立
  • secureConnectionStart 表示TLS握手开始
  • connectEnd 表示连接建立完成(同时也是TLS握手结束)

至于为什么没有 secureConnectionEnd 这个属性,应该是TLS的握手是在建立连接的最后一步,与 connectEnd 是一个时间点。

如果用的不是HTTPS协议,则 secureConnectionStart0,所以我们可以做一些兼容性的处理,如下代码:

// Quantifying total connection time
var pageNav = performance.getEntriesByType("navigation")[0];
var connectionTime = pageNav.connectEnd - pageNav.connectStart;
var tlsTime = 0; // <-- Assume 0 by default

// Did any TLS stuff happen?
if (pageNav.secureConnectionStart > 0) {
  // Awesome! Calculate it!
  tlsTime = pageNav.connectEnd - pageNav.secureConnectionStart;
}

在DNS查询和建立连接完成后,真正的请求才开始了。

请求与响应

当我们去思考到底是什么影响了请求速度的时候,一般可以归类为以下两点:

  • 外在因素: 网络延迟或者带宽,这些都是开发者无法掌控的。
  • 内在因素:服务器和客户端的架构、资源大小等等。

和这部分相关性能指标是重中之重。Navigation和Resource Timing都有如下相关指标:

  • fetchStart 表示浏览器开始获取资源的时间,并非是说从服务器获取,而是从检查缓存开始。
  • workerStart 表示从 service worker 开始获取资源的时间,如果没有安装service worker,则是 0
  • requestStart 表示浏览器开始发起网络请求的时间
  • responseStart 表示服务器响应的第一个字节到达的时间
  • responseEnd 表示服务器响应的最后一个字节到达的时间,即下载完成

我们可以用以下代码来获取资源下载的时间,以及缓存读取的时间

// Cache seek plus response time
var pageNav = performance.getEntriesByType("navigation")[0];
var fetchTime = pageNav.responseEnd - pageNav.fetchStart;

// Service worker time plus response time
var workerTime = 0;

if (pageNav.workerStart > 0) {
  workerTime = pageNav.responseEnd - pageNav.workerStart;
}

也可以去获取一些对我们有帮助的组合时间,代码如下:

// Request time only (excluding unload, redirects, DNS, and connection time)
var requestTime = pageNav.responseStart - pageNav.requestStart;

// Response time only (download)
var responseTime = pageNav.responseEnd - pageNav.responseStart;

// Request + response time
var requestResponseTime = pageNav.responseEnd - pageNav.requestStart;

其他

以上,我们已经获取了大部分重要的性能指标,但还有一些其他的指标也可以简单了解一下。

文档卸载

文档卸载发生在浏览器即将打开新的文档之前,一般而言,这不会出现什么大问题。但如果你绑定了 unload 事件,并在事件回调中执行了一些耗时的代码,你就需要去关注一下 unloadEventStartunloadEventEnd 这两个指标了。

unload 相关的指标只属于 Navigation Timing

跳转

一般情况下,跳转不是什么大问题,但如果频繁跳转,也会或多或少的影响页面的加载速度,看自身情况决定是否需要关注着几个指标 redirectStartredirectEnd

文档解析

文档加载之后,浏览器会解析文档。一般除非我们的文档特别大,解析的耗时才会影响页面加载。Navigation Timing提供了相关指标 domInteractivedomContentLoadedEventStartdomContentLoadedEventEnddomComplete

文档解析相关的指标也只属于 Navigation Timing。

加载

当文档和资源都加载完了之后,浏览器会触发一个 load 事件,这时相关的回调函数会依次执行,我们也可以去拿到加载时间的指标 loadEventStartloadEventEnd

以上两个指标也只属于 Navigation Timing

文档和资源的大小

文档和资源的大小毫无疑问是影响页面加载性能的关键因素。用API也能够拿到这些指标:

  • transferSize 表示资源传输总大小,包含header
  • encodedBodySize 表示压缩之后的body大小
  • decodedBodySize 表示解压之后的body大小

以下代码可以获取到一些其他信息:

// HTTP header size
var pageNav = performance.getEntriesByType("navigation")[0];
var headerSize = pageNav.transferSize - pageNav.encodedBodySize;

// Compression ratio
var compressionRatio = pageNav.decodedBodySize / pageNav.encodedBodySize;

其实资源和文档的大小都是开发者自己知道的,可以通过开发者工具看到,不一定要用API来获取这些信息。

在代码中实际应用

基本上上面对这些API都有了一个大致的了解,现在我们可以在代码中去收集这些指标数据了。

其他获取性能条目的函数

上面我们讲到一个 getEntriesByType 的函数可以获取指定类型的性能条目,还有另外两种:

getEntriesByName

getEntriesByName 可以通过名字来获取对应的条目。对 Navigation 和 Resource Timing 来说,名字就是文档或资源的URL地址:

// Get timing data for an important hero image
var heroImageTime = performance.getEntriesByName("https://somesite.com/images/hero-image.jpg");

getEntries

getEntriesByTypegetEntriesByName 不一样,getEntries 获取了所有的条目。

// Get timing data for all entries in the performance entry buffer
var allTheTimings = performance.getEntries();

这里我们有一个概念没提到 initiatorType,有兴趣可以去 MDN 上查询相关资料

用 PerformanceObserver 来监听性能条目

上面我们提到的三种函数都是一次性获取性能条目的,但这些都有以下两个问题:

  • 循环遍历性能条目的数组(可能很大),会阻塞主线程
  • 无法统计到新的请求或者新的指标。如果我们用定时器来尝试解决这个问题,代价太大,甚至可能会引发渲染冲突,导致jank

PerformanceObserver 就是为此而诞生的。以下是相关代码:

// Instantiate the performance observer
var perfObserver = new PerformanceObserver(function(list, obj) {
  // Get all the resource entries collected so far
  // (You can also use getEntriesByType/getEntriesByName here)
  var entries = list.getEntries();

  // Iterate over entries
  for (var i = 0; i < entries.length; i++) {
    // Do the work!
  }
});

// Run the observer
perfObserver.observe({
  // Polls for Navigation and Resource Timing entries
  entryTypes: ["navigation", "resource"]
});

需要注意的是 PerformanceObserver 目前还没不适用于所有浏览器,需要做一些兼容处理:

// Should we even be doing anything with perf APIs?
if ("performance" in window) {
  // OK, yes. Check PerformanceObserver support
  if ("PerformanceObserver" in window) {
    // Observe ALL the performance entries!
  } else {
    // WOMP WOMP. Find another way. Or not.
  }
}

一些陷阱

看上去统计上面这些性能指标都很简单,但还有一些比较棘手的情况。

Cross-origins 和 Timing-Allow-Origin 的响应头

并非所有的性能指标我们都能获取到,如果没有携带一些响应头,某些指标可能就一直是 0,想要完全掌握这部分,需要去标准文档细读。

持久连接会影响时序

当HTTP/1.1的请求带了 Connection: Keep-Alive 的响应头的时候,此连接会被复用。或者当我们用的是HTTP/2的时候,一个连接会被所有同源资源复用。这些都会影响时间统计,不过我们不用太刻意去检查这些,稍微留个心就好了。

不是所有浏览器都支持这些API

对Web开发者而言,浏览器兼容性是无法避免的问题。而且 getEntriesByType 这个API函数,如果获取一个不支持的类型的性能条目,浏览器并不会报错,而是返回空数组,如以下代码:

// This returns stuff!
performance.getEntriesByType("resource");

// Not so much. :\
performance.getEntriesByType("navigation");

为此,我们可以稍作兼容:

if (performance.getEntriesByType("navigation").length > 0) {
  // Yay, we have Navigation Timing stuff!
}

并非所有浏览器都支持这些API,用的时候尽量做一些检测,避免产生一些错误的统计。

收集数据

我们已经知道了如何使用这些API获取性能指标,但这些数据我们应该放在哪里?

使用navigator.sendBeacon

navigator.sendBeacon 是一种非阻塞的请求方式,不用等待服务器响应,只是单方面的数据发送,是收集RUM数据的一个最佳方案,即使页面关闭,浏览器依然会将这些请求发送完成。

// Caution: If you have a _lot_ of performance entries, don't send _everything_ via getEntries. This is just an example.
let rumData = JSON.stringify(performance.getEntries()));

// Check for sendBeacon support:
if ('sendBeacon' in navigator) {
  // Beacon the requested
  if (navigator.sendBeacon('/analytics', rumData)) {
    // sendBeacon worked! We're good!
  } else {
    // sendBeacon failed! Use XHR or fetch instead
  }
} else {
  // sendBeacon not available! Use XHR or fetch instead
}

服务端要获取这些数据,可以从post表单中获取,或者从get的参数中获取。

navigator.sendBeacon 调用的时候,只是往队列里面插入了一个,等待浏览器资源空闲,会将请求发送出去。如果资源过大,浏览器也可能会拒绝发送。

总结

如果你对这些还不够自信,千万不要直接就应用在项目代码中,建议详细阅读相关标准文档之后,再尝试应用在项目中。有了这些性能指标数据,我们可以随时修复一些发现的问题。

另外,你也不用把所有指标都存到服务器,选一些自己觉得有用的就好。

本文档只是一个引导性质的,并不能完全代表这些API的所有使用方式,建议还是阅读以下相关标准文档(文中链接)。

有了这些API,你就能更加了解真是用户的使用场景。

参考

https://developers.google.com/web/fundamentals/performance/navigation-and-resource-timing

猜你喜欢

转载自blog.csdn.net/wuchen092832/article/details/107437469