精读《JS 引擎基础之 Shapes and Inline Caches》

一起了解下 JS 引擎是如何运作的吧!

JS 的运作机制可以分为 AST 分析、引擎执行两个步骤:

image

JS 源码通过 parser(分析器)转化为 AST(抽象语法树),再经过 interperter(解释器)解析为 bytecode(字节码)。

为了提高运行效率,optimizing compiler(优化编辑器)www.xsjtv.org负责生成 optimized code(优化后的机器码)。

本文主要从 AST 之后说起。

2 概述

JS 的解释器、优化器

JS 代码可能在字节码或者优化后的机器码状态下执行,而生成字节码速度很快,而生成机器码就要慢一些了。

image

V8 也类似,V8 将 interpreter 称为 Ignition(点火器),将 optimizing compiler 成为 TurboFan(涡轮风扇发动机)。

image

可以理解为将代码先点火启动后,逐渐进入涡轮发动机提速。

代码先快速解析成可执行的字节码,在执行过程中,利用执行中获取的数据(比如执行频率),将一些频率高的方法,通过优化编译器生成机器码以提速。

image

火狐使用的 Mozilla 引擎有一点点不同,使用了两个优化编译器,先将字节码优化为部分机器码,再根据这个部分优化后的代码运行时拿到的数据进行最终优化,生成高度优化的机器码,如果优化失败将会回退到部分优化的机器码。

笔者:不同前端引擎对 JS 优化方式大同小异,后面会继续列举不同前端引擎在解析器、编译器部分优化的方式。

image

微软的 Edge 浏览器,使用的 Chakra 引擎,优化方式与 Mozilla 很像,区别是第二个最终优化的编译器同时接收字节码和部分优化的机器码产生的数据,新视觉影院并且在优化失败后回退到第一步字节码而不是第二步。

image

Safari、React Native 使用的 JSC 引擎则更为极端,使用了三个优化编译器,其优化是一步步渐进的,优化失败后都会回退到第一步部分优化的机器码。

为什么不同前端引擎会使用不同的优化策略呢?这是由于 JS 要么使用解释器快速执行(生成字节码),或者优化成机器码后再执行,但优化消耗时间的并不总是小于字节码低效运行损耗的时间,所以有些引擎选择了多个优化编译器,逐层优化,尽可能在解析时间与执行效率中找到一个平衡点。

JS 的对象模型

JS 是基于面向对象的,那么 JS 引擎是如何实现 JS 对象模型的呢?他们用了哪些技巧加速访问 JS 对象的属性?

和解析器、优化器一样,大部分主流 JS 引擎在对象模型实现上也很类似。

image

ECMAScript 规范确定了对象模型就是一个以字符串为 key 的字典,除了其值以外,还定义了 Writeable EnumerableConfigurable 这些配置,表示这个 key 能否被重写、遍历访问、配置。

虽然规范定义了 [[]] 双括号的写法,那这不会暴露给用户,暴露给用户的是 Object.getOwnPropertyDescriptor 这个 API,可以拿到某个属性的配置。


在 JS 中,数组是对象的特殊场景,相比对象,数组拥有特定的下标,根据 ECMAScript 规范规定,数组下标的长度最大为 2³²−1。同时数组拥有 length 属性:

image

length 只是一个不可枚举、不可配置的属性,并且在数组赋值时,会自动更新数值:

image

所以数组是特殊的对象,结构完全一致。

属性访问效率优化

属性访问是最常见的,所以 JS 引擎必须对属性访问做优化。

Shapes

JS 编程中,给不同对象相同的 key 名很常见,访问不同对象的同一个 propertyKey 也很常见:

const object1 = { x: 1, y: 2 };
const object2 = { x: 3, y: 4 }; function logX(object) { console.log(object.x); // ^^^^^^^^ } logX(object1); logX(object2);

这时 object1 与 object2 拥有一个相同的 shape。拿拥有 xy 属性的对象来看:

image

如果访问 object.y,JS 引擎会先找到 key y,再查找 [[value]]

如果将属性值也存储在 JSObject 中,像 object1 object2 就会出现许多冗余数据,因此引擎单独存储 Shape,与真实对象隔离:

image

这样具有相同结构的对象可以共享 Shape。所有 JS 引擎都是用这种方式优化对象,但并不都称为 Shape,这里就不详细罗列了,可以去原文查看在各引擎中 Shape 的别名。

Transition chains 和 Transition trees

如果给一个对象增加了 key,JS 引擎如何生成新的 Shape 呢?

这种 Shape 链式创建的过程,称为 Transition chains:

image

开始创建空对象时,JSObject 和 Shape 都是空,当为 x 赋值 5 时,在 JSObject 下标 0 的位置添加了 5,并且 Shape 指向了拥有字段 x 的 Shape(x),当赋值 y 为 6 时,在 JSObject 下标 1 的位置添加了 6,并将 Shape 指向了拥有字段 x 和 y 的 Shape(x, y)

而且可以再优化,Shape(x, y) 由于被 Shape(x) 指向,所以可以省略 x 这个属性:

image

笔者:当然这里说的主要是优化技巧,我们可以看出来,JS 引擎在做架构设计时没有考虑优化问题,而在架构设计完后,再回过头对时间和空间进行优化,这是架构设计的通用思路。

如果没有连续的父 Shape,比如分别创建两个对象:

const object1 = {};
object1.x = 5;
const object2 = {};
object2.y = 6;

这时要通过 Transition trees 来优化:

image

可以看到,两个 Shape(x) Shape(y) 别分继承 Shape(empty)。当然也不是任何时候都会创建空 Shape,比如下面的情况:

const object1 = {};
object1.x = 5;
const object2 = { x: 6 };

生成的 Shape 如下图所示:

image

可以看到,由于 object2 并不是从空对象开始的,所以并不会从 Shape(empty) 开始继承。

Inline Caches

大概可以翻译为“局部缓存”,JS 引擎为了提高对象查找效率,需要在局部做高效缓存。

比如有一个函数 getX,从 o.x 获取值:

function getX(o) {
  return o.x; }

JSC 引擎 生成的字节码结构是这样的:

image

get_by_id 指令是获取 arg1 参数指向的对象 x,并存储在 loc0,第二步则返回 loc0

当执行函数 getX({ x: 'a' }) 时,引擎会在 get_by_id 指令中缓存这个对象的 Shape

image

这个对象的 Shape 记录了自己拥有的字段 x 以及其对应的下标 offset

image

执行 get_by_id 时,引擎从 Shape 查找下标,找到 x,这就是 o.x 的查找过程。但一旦找到,引擎就会将 Shape保存的 offset 缓存起来,下次开始直接跳过 Shape 这一步:

image

以后访问 o.x 时,只要 Shape 相同,引擎直接从 get_by_id 指令中缓存的下标中可以直接命中要查找的值,而这个缓存在指令中的下标就是 Inline Cache.

数组存储优化

和对象一样,数组的存储也可以被优化,而由于数组的特殊性,不需要为每一项数据做完整的配置。

比如这个数组:

const array = ["#jsconfeu"];

猜你喜欢

转载自www.cnblogs.com/xinshijue6080/p/9222874.html
今日推荐