Java并发编程实战————ThreadLocal

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/u014745069/article/details/82947189

一、引言

ThreadLocal是Java帮助实现线程封闭性的典型手段。

作用:提供线程内的局部变量,这种变量在线程的生命周期内起作用,减少同一个线程内多个函数或组件之间一些公共变量的传递复杂度。同时也用来维护线程中的变量不被其他线程干扰。

这个类能使线程中的某个值与保存值的对象关联起来。ThreadLocal提供了get 与set方法,这些方法为每个使用该变量的线程都存有一份独立的副本,因此get总是返回由当前执行线程在调用set时设置的最新值

二、ThreadLocal的简单应用

 ThreadLocal是使用空间换时间,synchronized是使用时间换空间,比如在hibernate中session就存在于ThreadLocal中,避免synchronized的使用。

下面程序的输出结果为null,因为从ThreadLocal中取出的对象一定是本线程中set的对象,别的线程无法取出,因为线程自己放入的对象只能自己取得,因此无需进行加锁处理,执行效率上ThreadLocal比synchronized要高。

public class ThreadLocal_02 {
    static ThreadLocal<Person> tl = new ThreadLocal<>();

    public static void main(String[] args) {
        new Thread(() -> {
            try {
                TimeUnit.SECONDS.sleep(2);
            } catch (Exception e) {
                e.printStackTrace();
            }
            System.out.println(tl.get()); // output : null

        }).start();

        new Thread(() -> {
            try {
                TimeUnit.SECONDS.sleep(1);
            } catch (Exception e) {
                e.printStackTrace();
            }
            tl.set(new Person("张三"));
        }).start();
    }

    static class Person {
        String name;
        
        public Person(String name) {
            this.name = name;
        }
    }
}

三、对ThreadLocal的理解

ThreadLocal对象通常用于防止对可变的单例变量或全局变量进行共享。

例如,在单线程应用程序中可能会维持一个全局的数据库连接,并在程序启动时初始化这个连接对象,从而避免在调用每个方法时都要传递一个Connection对象。由于JDBC的连接对象不一定是线程安全的,因此,当多线程应用程序在没有协同的情况下使用全局变量时,就不是线程安全的。通过将JDBC的连接保存到ThreadLocal对象中,每个线程都会拥有属于自己的连接:

    private static ThreadLocal<Connection> connectionHolder = new ThreadLocal<Connection>(){
        public Connection initialValue() {
            return DriverManager.getConnection(DB_URL);
        }
    };
    
    public static Connection getConnection() {
        return connectionHolder.get();
    }

在比如,当某个频繁执行的操作需要一个临时对象,例如一个缓冲区,而同时又希望避免在每次执行时都重新分配该临时对象,就可以使用ThreadLocal。

四、ThreadLocal的实现原理

ThreadLocal内部提供了四个对外开放的接口方法,这也是用户操作ThreadLocal对象的基本方法:

1、public T get() :取得线程局部变量

2、public void set(T value) :设置线程局部变量

3、public void remove() :删除线程局部变量

4、protected T initialValue() :返回该线程局部变量初始值

思考:ThreadLocal的实例是如何为每一个线程维护变量副本的呢?

上图来自http://www.importnew.com/22039.html

其实,每一个线程Thread其内部都维护一个ThreadLocal.ThreadLocalMap的实例对象(变量名为:threadLocals)。

你可以将这个ThreadLocalMap对象理解为一个Map,但实际上它是一个数组,一个以封装了ThreadLocal为键,Object为值的元素的数组。也就是说ThreadLocal本身不存储值,它只是作为一个key来让当前线程从ThreadLocalMap中获取value。值得注意的是,ThreadLocalMap是使用 ThreadLocal的弱引用作为 Key 的,弱引用的对象在GC时会被回收。

static class ThreadLocalMap {
        //map中的每个节点Entry,其键key是ThreadLocal并且还是弱引用
        static class Entry extends WeakReference<ThreadLocal<?>> {
            
            Object value;

            Entry(ThreadLocal<?> k, Object v) {
                super(k);
                value = v;
            }
        }
        // 初始化容量为16,以为对其扩充也必须是2的指数
        private static final int INITIAL_CAPACITY = 16;
        // 真正用于存储线程的每个ThreadLocal的数组,将ThreadLocal和其对应的值包装为一个Entry
        private Entry[] table;

        ///....其他方法和操作都和map类似
}

由此,我们可以大概了解到了其线程局部变量的维护机制:为不同的线程创建不同的ThreadLocalMap,以线程本身作为区分,每个线程之间没有任何联系。

下面感兴趣可以看一下get()、set()的源码:

public T get() {
    Thread t = Thread.currentThread();//当前线程
    ThreadLocalMap map = getMap(t);//获取当前线程对应的ThreadLocalMap
    if (map != null) {
        ThreadLocalMap.Entry e = map.getEntry(this);//获取对应ThreadLocal的变量值
        if (e != null) {
            @SuppressWarnings("unchecked")
            T result = (T)e.value;
            return result;
        }
    }
    //若当前线程还未创建ThreadLocalMap,则返回调用此方法并在其中调用createMap方法进行创建并返回初始值。
    return setInitialValue();
}
public void set(T value) {
   Thread t = Thread.currentThread();
   ThreadLocalMap map = getMap(t);
   if (map != null)
       map.set(this, value);
   else
       createMap(t, value);
}

五、ThreadLocal内存泄漏问题

5.1 ThreadLocal为什么会内存泄漏?

ThreadLocalMap使用ThreadLocal的弱引用作为key,如果一个ThreadLocal没有外部强引用来引用它,那么系统 GC 的时候,这个ThreadLocal势必会被回收,这样一来,ThreadLocalMap中就会出现key为null的Entry,就没有办法访问这些key为null的Entry的value,如果当前线程再迟迟不结束(如线程池的线程回收)的话,这些key为null的Entry的value就会一直存在一条强引用链:Thread Ref -> Thread -> ThreaLocalMap -> Entry -> value 永远无法回收,造成内存泄漏。 

其实,ThreadLocalMap的设计中已经考虑到这种情况,也加上了一些防护措施:在ThreadLocal的get(),set(),remove()的时候都会清除线程ThreadLocalMap里所有key为null的value。

但这些被动的预防措施并不能保证不会内存泄漏。

5.2 为什么使用弱引用?

从表面上看内存泄漏的根源在于使用了弱引用。网上的文章大多着重分析ThreadLocal使用了弱引用会导致内存泄漏,但是另一个问题也同样值得思考:为什么使用弱引用而不是强引用?

我们先来看看官方文档的说法:

To help deal with very large and long-lived usages, the hash table entries use WeakReferences for keys.
为了应对非常大和长时间的用途,哈希表使用弱引用的 key。

下面我们分两种情况讨论:

  • key 使用强引用:引用的ThreadLocal的对象被回收了,但是ThreadLocalMap还持有ThreadLocal的强引用,如果没有手动删除,ThreadLocal不会被回收,导致Entry内存泄漏。
  • key 使用弱引用:引用的ThreadLocal的对象被回收了,由于ThreadLocalMap持有ThreadLocal的弱引用,即使没有手动删除,ThreadLocal也会被回收。value在下一次ThreadLocalMap调用set,get,remove的时候会被清除。

比较两种情况,我们可以发现:由于ThreadLocalMap的生命周期跟Thread一样长,如果都没有手动删除对应key,都会导致内存泄漏,但是使用弱引用可以多一层保障:弱引用ThreadLocal不会内存泄漏,对应的value在下一次ThreadLocalMap调用set,get,remove的时候会被清除。

因此,ThreadLocal内存泄漏的根源是:由于ThreadLocalMap的生命周期跟Thread一样长,如果没有手动删除对应Key就会导致内存泄漏,而不是因为弱引用。

5.3 有效避免内存泄漏的最佳实践

每次使用完ThreadLocal,都调用它的remove()方法,清除数据。

六、鸣谢

深入剖析ThreadLocal实现原理以及内存泄漏问题

深入分析 ThreadLocal 内存泄漏问题

猜你喜欢

转载自blog.csdn.net/u014745069/article/details/82947189