对象引用计数器

引用计数算法作为垃圾收集器最早的算法，有其优势，也有其劣势，虽然现在的JVM都不再采用引用计数算法进行垃圾回收【例如Sun的Java hotspot采用了火车算法进行垃圾回收】，但这种算法也并未被淘汰，在著名的单进程高并发缓存Redis中依然采用这种算法来进行内存回收【后绪会以Redis作为例子，说明该算法】

什么是引用计数算法

直白一点，就是对于创建的每一个对象都有一个与之关联的计数器，这个计数器记录着该对象被使用的次数，垃圾收集器在进行垃圾回收时，对扫描到的每一个对象判断一下计数器是否等于0，若等于0，就会释放该对象占用的内存空间,同时将该对象引用的其他对象的计数器进行减一操作

详细介绍大家请移步到百度百科-引用计数

两种实现方式

侵入式与非侵入性，引用计数算法的垃圾收集一般有侵入式与非侵入式两种，侵入式的实现就是将引用计数器直接根植在对象内部，用C++的思想进行解释就是，在对象的构造或者拷贝构造中进行加一操作，在对象的析构中进行减一操作，非侵入式恩想就是有一块单独的内存区域，用作引用计数器

算法的优点

使用引用计数器,内存回收可以穿插在程序的运行中，在程序运行中，当发现某一对象的引用计数器为0时，可以立即对该对象所占用的内存空间进行回收，这种方式可以避免FULL GC时带来的程序暂停，如果读过Redis的源码，可以发现Redis中就是在引用计数器为0时，对内存进行了回收。

算法的劣势

采用引用计数器进行垃圾回收，最大的缺点就是不能解决循环引用的问题，例如一个父对象持有一个子对象的引用，子对象也持有父对象的引用，这种情况下，父子对象将一直存在于JVM的堆中，无法进行回收,代码示例如下所示(引用计数器无法对a与b对象进行回收):

class A {
    private B b;
    public B getB() {
        return b;
    }
    public void setB(B b) {
        this.b = b;
    }
}

class B {
    private A a;
    public A getA() {
        return a;
    }
    public void setA(A a) {
        this.a = a;
    }
}

public class Test {
    public static void main(String[] args) {
        A a = new A();
        B b = new B();
        a.setB(b);
        b.setA(a);
    }
}

以上内容摘录自垃圾收集器:引用计数算法。

Redis 源码例子

为了更清楚的理解对象引用计数器，我们来看看《PHP核心技术与最佳实践》一书中对 redis 源码的分析：

在redis中，设想以下场景：一个客户端调用get命令获取一个较大的key时（不能通过一次网络I/O把数据传输完毕），另一个客户端调用del命令删除此key，如果此时没有对key进行任何保护，get操作就有可能导致内存段错误（因为del操作已经把key从内存删除，而get操作还在进行，这样get操作就会访问到非法内存地址）。

为了解决这个问题，Redis使用对象引用计数器。原理是：给对象添加一个引用计数器，每当有地方引用它时，计数器值就加 1，当引用失效时，计数器值就减 1 ，当引用计数器值为 0 时，Redis便把此对象从内存中删除。

引用计数器巧妙的解决了get命令和del命令的冲突问题，原理如下图所述：

这里写图片描述

要理解对象引用计数器，先了解Redis的对象。在Redis中，所有的key和value都是通过对象（Redis Object）进行存储的，对象的结构体定义如下：

typedef struct redisObject {
    unsigned type:4;
    ubsigned storage:2;
    unsigned encoding:4;
    unsigned lru:22;
    int refcount;    //引用计数器
    void *ptr;    //指向实际的对象空间
} robj;

robj 结构体中的 ptr 字段指向数据的内存地址，refcount 字段就是引用计数器。下面看看 Redis 怎样通过引用计数器解决上面的问题。

当 Redis 创建一个对象时，把对象的引用计数器初始化为 1，代码如下：

robj *createObject(int type, void *ptr) {
    robj *o = zmalloc(sizeof(*o));
    o->type = type;
    o->encoding = REDIS_ENCODING_RAW;
    o->ptr = ptr;
    //创建时将引用计数器初始为1
    o->refcount = 1;
    o->lru = server.lruclock;
    o->storage = REDIS_VM_MEMORY;
    return o;
}

当客户端调用 get 命令获取一个 key 时，调用 incrRefCount 函数把对象的引用计数器加 1，incrRefCount 函数代码如下：

void incrRefCount(robj *o){
    o -> refcount ++;
}

所以，只有一个客户端使用get命令获取key时，此 key 的对象引用计数器应该为2。通过 “object refcount (key)”命令查看一个 key 的引用计数器。

当客户端调用 del 命令时，Redis 调用 decrRefCount 函数把对象的引用计数器减 1 ，如果对象的引用计数器等于 0 ，Redis才把对象从内存中删除。decrRefCount 函数代码如下：

void decrRefCount(robj *o) {
    if (o->refcount <= 0) redisPanic("decrRefCount against refcount <= 0");
    if (o->refcount == 1) {
        switch(o->type) {
            case REDIS_STRING: freeStringObject(o); break;
            case REDIS_LIST: freeListObject(o); break;
            case REDIS_SET: freeSetObject(o); break;
            case REDIS_ZSET: freeZsetObject(o); break;
            case REDIS_HASH: freeHashObject(o); break;
            default: redisPanic("Unknown object type"); break;
        }
        zfree(o);    //通过zmollac申请内存，通过zfree释放内存
    } else {
        o->refcount--;
    }
}

从上面的分析可知，使用对象引用计数器后，当 get 操作还没完成时调用 del 命令也不会出现内存段错误。这是因为调用 get 命令后对象的引用计数器加 1 ，所以此时调用 del 命令也不会使其引用计数器变为 0（不会从内存中删除此 key）。

调用 del 命令后在什么时候才将这个 key 从内存中删除呢？答案是等待所有的 get 操作完成后（如果同时有多个客户端调用 get 命令，就要等待所有客户端完成后）。当一个 get 操作完成后，Redis 把此 key 的引用计数器减 1。而当所有的get操作都完成后，此 key 的引用计数器将变为 0，此时，Redis 就把这个 key 从内存中删除。

这部分内容摘录自《PHP核心技术与最佳实践》。

什么是引用计数算法

两种实现方式

算法的优点

算法的劣势

Redis 源码例子

猜你喜欢