iOS开发-深入理解Tagged Pointer

引言

苹果为了节省内存和提高执行效率,苹果提出了Tagged Pointer的概念。对于 64 位程序,引入 Tagged Pointer 后,相关逻辑能减少一半的内存占用,以及 3 倍的访问速度提升,100 倍的创建、销毁速度提升。本文从Tagged Pointer试图解决的问题入手,理解Tagged Pointer的实现细节和优势,以及使用时的注意事项。

问题

我们先看看原有的对象为什么会浪费内存。假设我们要存储一个 NSNumber 对象,其值是一个整数。正常情况下,如果这个整数只是一个 NSInteger 的普通变量,那么它所占用的内存是与 CPU 的位数有关,在 32 位 CPU 下占 4 个字节,在 64 位 CPU 下是占 8 个字节的。而指针类型的大小通常也是与 CPU 位数相关,一个指针所占用的内存在 32 位 CPU 下为 4 个字节,在 64 位 CPU 下也是 8 个字节。

所以一个普通的 iOS 程序,如果没有Tagged Pointer对象,从 32 位机器迁移到 64 位机器中后,虽然逻辑没有任何变化,但这种 NSNumber、NSDate 一类的对象所占用的内存会翻倍。

我们再来看看效率上的问题,为了存储和访问一个 NSNumber 对象,我们需要在堆上为其分配内存,另外还要维护它的引用计数,管理它的生命期,这些都给程序增加了额外的逻辑,造成运行效率上的损失,但该 NSNumber 对象仅仅是存储了一个NSInteger 的普通变量,这样并不划算。

Tagged Pointer 

为了改进上面提到的内存占用和效率问题,苹果提出了Tagged Pointer对象。由于 NSNumber、NSDate 一类的变量本身的值需要占用的内存大小常常不需要 8 个字节,拿整数来说,4 个字节所能表示的有符号整数就可以达到 20 多亿,对于绝大多数情况都是可以处理的。

所以我们可以将一个对象的指针拆成两部分,一部分直接保存数据,另一部分作为特殊标记,表示这是一个特别的指针,不指向任何一个地址。所以,引入了Tagged Pointer对象之后,64 位 CPU 下 NSNumber 的内存图变成了以下这样:

示例

NSNumber

NSMutableString *mutStr = [NSMutableString stringWithString:@"1"];
for(int i=0; i<20; i+=1){
    NSNumber *number = @([mutStr longLongValue]);
    NSLog(@"%@, %p", [number class], number);
    [mutStr appendString:@"1"];
}
NSLog:
__NSCFNumber, 0xb000000000000013
__NSCFNumber, 0xb0000000000000b3
__NSCFNumber, 0xb0000000000006f3
__NSCFNumber, 0xb000000000004573
__NSCFNumber, 0xb00000000002b673
__NSCFNumber, 0xb0000000001b2073
__NSCFNumber, 0xb0000000010f4473
__NSCFNumber, 0xb00000000a98ac73
__NSCFNumber, 0xb000000069f6bc73
__NSCFNumber, 0xb000000423a35c73
__NSCFNumber, 0xb000002964619c73
__NSCFNumber, 0xb000019debd01c73
__NSCFNumber, 0xb000102b36211c73
__NSCFNumber, 0xb000a1b01d4b1c73
__NSCFNumber, 0xb00650e124ef1c73
__NSCFNumber, 0xb03f28cb71571c73
__NSCFNumber, 0xb27797f26d671c73
__NSCFNumber, 0x608000037e40
__NSCFNumber, 0x608000037e40
__NSCFNumber, 0x60000003a4c0

可以看到NSNumber的数值是1、11、111、1111...以此递增的,但是指针地址的最低4位一直为3,因此此时指针地址最低4位用于标记NSNumber的类型,3为long、float为4、Int为2、double为5。

而最高4位则一直为“b”,指针地址最高4位用于标记是NSNumber类型。其余56位则用来存储数值本身内容的数值位

当存储用的数值超过56位存储上限的时候,那么NSNumber才会用真正的64位内存地址存储数值,然后用指针指向该内存地址。

NSString

NSMutableString *mutStr = [NSMutableString stringWithString:@"1"];
for(int i=0; i<20; i+=1){
    NSString *str = [NSString stringWithString:mutStr];
    NSLog(@"%@, %p", [str class], str);
    [mutStr appendString:@"1"];
}
NSLog:
NSTaggedPointerString, 0xa000000000000311
NSTaggedPointerString, 0xa000000000031312
NSTaggedPointerString, 0xa000000003131313
NSTaggedPointerString, 0xa000000313131314
NSTaggedPointerString, 0xa000031313131315
NSTaggedPointerString, 0xa003131313131316
NSTaggedPointerString, 0xa313131313131317
NSTaggedPointerString, 0xa0079e79e79e79e8
NSTaggedPointerString, 0xa1e79e79e79e79e9
NSTaggedPointerString, 0xa03def7bdef7bdea
NSTaggedPointerString, 0xa7bdef7bdef7bdeb
__NSCFString, 0x6080002225e0
__NSCFString, 0x6080002224a0
__NSCFString, 0x6080002224e0
__NSCFString, 0x60800004b1f0
__NSCFString, 0x600000048d90

可以看到NSString也是1、11、111、1111...以此递增的,而且指针地址的最低4位也一直在递增,因此此时指针地址的最低4位表示字符的length

而最高4位则一直为“a”,指针地址​​​​​​​最高4位用于标记是NSString类型。其余56位则用来存储数值本身内容的数值位

这里使用ASCII码进行存储,1的ASCII码为49,转为十六进制为31。(字符串中含有ASCII码中不存在的字符时,就不会使用Tagged Pointer进行存储)。

这里需要注意的是,当字符串长度超过了56位的时候,Tagged Pointer并没有立即用指针转向内存,而是用了一种编码压缩算法,把字符串长度进行压缩存储,当这个算法压缩的数据长度超过56位了才使用指针指向内存,也就是字符串长度超过11时。

特点

我们也可以在 WWDC2013 的《Session 404 Advanced in Objective-C》视频中,看到苹果对于Tagged Pointer特点的介绍:

  1. Tagged Pointer专门用来存储小的对象,例如NSNumberNSDate、NSString
  2. Tagged Pointer指针的值不再是地址了,而是真正的值。所以,实际上它不再是一个对象了,它只是一个披着对象皮的普通变量而已。所以,它的内存并不存储在堆中,也不需要 malloc 和 free。
  3. 在内存读取上有着 3 倍的效率,创建时比以前快 106 倍。

由此可见,苹果引入Tagged Pointer,不但减少了 64 位机器下程序的内存占用,还提高了运行效率。完美地解决了小内存对象在存储和访问效率上的问题。

isa 指针

Tagged Pointer的引入也带来了问题,即Tagged Pointer因为并不是真正的对象,而是一个伪对象,所以你如果完全把它当成对象来使,可能会让它露马脚。因为Tagged Pointer是没有isa指针的,所以它不是真正的对象。

因为不是真正的对象,所以如果你直接访问Tagged Pointerisa成员的话,在编译时将会得到警告。

只要避免在代码中直接访问对象的 isa 变量,即可避免这个问题。

参考文献

深入理解Tagged Pointer-唐巧

iOS Tagged Pointer

猜你喜欢

转载自blog.csdn.net/qq_36557133/article/details/100189584