什么情况下Java程序会产生死锁?

典型回答

死锁是一种特定的程序状态,在实体之间,由于循环依赖导致彼此一直处于等待之中,没有任何个体可以继续前进。死锁不仅仅会发生在线程之间,存在资源独占的进程之间同样也可能出现死锁。通常来说,我们大多是聚焦在多线程场景中的死锁,指两个或多个线程之间,由于互相持有对方需要的锁,而永久处于阻塞的状态。

就像下图中所示:

定位死锁最常见的方式就是利用jstack等工具获取线程栈,然后定位互相之间的依赖关系,进而找到死锁。如果是比较明显的死锁,往往jstack等就能直接定位,类似JConsole甚至可以在图形界面进行有限的死锁检测。

如果程序运行时发生了死锁,绝大多数情况下都是无法在线解决的,只能重启、修正程序本身问题。所以,代码开发阶段互相审查,或者利用工具进行预防性排查,往往也是很重要的。

知识扩展

下面这个程序,只用了两个嵌套的synchronized去获取锁,几乎每次都可以重现死锁:

public class DeadLockSample extends Thread {
  private String first;
  private String second;
  public DeadLockSample(String name, String first, String second) {
    super(name);
    this.first = first;
    this.second = second;
  }

  public void run() {
    synchronized (first) {
      System.out.println(this.getName() + " obtained: " + first);
      try {
        Thread.sleep(1000L);
        synchronized (second) {
          System.out.println(this.getName() + " obtained: " + second);
        }
      } catch (InterruptedException e) {
        // Do Nothing
      }
    }
  }

  public static void main(String[] args) throws InterruptedException {
    String lockA = "lockA";
    String lockB = "lockB";
    DeadLockSample t1 = new DeadLockSample("Thread1", lockA, lockB);
    DeadLockSample t2 = new DeadLockSample("Thread2", lockB, lockA);
    t1.start();
    t2.start();
    t1.join();
    t2.join();
  }
}

某一次的输出如下:

Thread2 obtained: lockB
Thread1 obtained: lockA

这里有个比较有意思的地方,为什么先调用Thread1的start,但是Thread2却先打印出来了呢?这就是因为线程调度依赖于操作系统调度器。虽然你可以通过优先级之类进行影响,但是具体情况是不确定的。

下面来模拟问题定位,这里就选取最常见的jstack。首先,可以使用jps或者系统的ps命令、任务管理器等工具,确定进程ID。第二步,调用jstack获取线程栈:

>jstack your-pid

然后,分析得到的输出,具体片段如下:

Java stack information for the threads listed above:
===================================================
"Thread2":
        at cn.liximing.study.javacore.DeadLockSample.run(DeadLockSample.java:23)
        - waiting to lock <0x000000078097aea0> (a java.lang.String)
        - locked <0x000000078097aed8> (a java.lang.String)
"Thread1":
        at cn.liximing.study.javacore.DeadLockSample.run(DeadLockSample.java:23)
        - waiting to lock <0x000000078097aed8> (a java.lang.String)
        - locked <0x000000078097aea0> (a java.lang.String)

Found 1 deadlock.

上面的输出可以看出,jstack本身也会把类似的简单死锁抽取出来,直接打印出来。但是一些复杂的情况,则需要分析各个线程持有的锁,以及等待的锁进行分析。

如何在编程中尽量预防死锁?

首先,我们来总结一下前面例子中死锁的产生包含了哪些基本元素。基本上死锁的发生是因为:

  • 互斥条件,类似Java中Monitor都是独占的,要么是我用,要么是你用。
  • 互斥条件是长期持有的,在使用结束之前,自己不会释放,也不能被其它线程抢占。
  • 循环依赖关系,两个或者多个个体之间出现了锁的链条环。

据此分析得到以下一些避免死锁的思路和方法。

方法一:如果可能的话,尽量避免使用多个锁,并且只有需要时才持有锁。

程序之所以需要持有多个锁,就是因为需要持有多个资源。从程序设计的角度反思,如果我们赋予一段程序太多的职责,出现“既要……又要……”的情况时,可能就需要我们审视下设计思路或目的是否合理了。

方法二:如果必须使用多个锁,尽量设计好锁的获取顺序。

这个说起来简单,做起来可不容易,你可以参考著名的“银行家算法”。一般的情况,建议可以采取一些简单的辅助手段。比如:将对象(方法)和锁之间的关系,用图形化的方式分别抽取出来。然后根据对象之间组合、调用的关系对比和组合,考虑可能调用的时序。按照可能时序合并,发现可能死锁的场景。

方法三:使用带超时的方法,为程序带来更多可控性。

类似Object.wait(...)或者CountDownLatch.await(...),都支持所谓的timed_wait,我们完全可以不假定该锁一定会获得,指定超时时间,并为无法得到锁时准备退出逻辑。

并发Lock实现,如ReentrantLock还支持非阻塞式的获取锁操作tryLock(),这是一个插队行为(barging),并不在乎等待的公平性。如果执行时对象恰好没有被独占,则直接获取锁。有时,我们希望条件允许就尝试插队,不然就按照现有公平性规则等待,一般采用下面的方法:

if (lock.tryLock() || lock.tryLock(timeout, unit)) {
  // ...
}

方法四:通过静态代码分析工具去查找固定模式。

业界也有一些其它方面的尝试,比如通过静态代码分析(如FindBugs)去查找固定的模式,进而定位可能的死锁或者竞争情况。实践证明这种方法也有一定的作用。

【完】

猜你喜欢

转载自blog.csdn.net/qweqwruio/article/details/81359744