1.定义

死锁是线程的一种常见活性故障。如果两个或者更多的线程因相互等待对方而被永远暂停(线程的生命周期状态为 BLOCKED 或者 WAITING), 那么我们就称这些线程产生了死锁(Deadlock)。 由于产生死锁的线程的生命周期状态永远是非运行状态,因此这些线程所要执行的任务也永远无法进展。死锁产生的一种典型情形如下图。

2.死锁产生的条件

线程一旦产生死锁,那么这些线程及相关的资源将满足如下全部条件。

  • 资源互斥。涉及的资源必须是独占的,即每个资源一次只能够被一个线程使用。
  • 资源不可抢夺。涉及的资源只能够被其持有者(线程)主动释放,而无法被资源的持有者和申请者之外的第三方线程所抢夺(被动释放)。
  • 占用并等待资源。涉及的线程当前至少持有一个资源(资源 A)并申请其他资源(资源B),而这些资源(资源 B) 恰好被其他线程持有 。 在这个资源等待的过程中,线程并不释放其已经持有的资源 。
  • 循环等待资源。涉及的线程必须在等待别的线程持有的资源,而这些线程又反过来在等待第1个线程所持有的资源。

这些条件是死锁产生的必要条件而非充分条件,也就是说只要产生了死锁,那么上面这些条件一定同时成立,但是上述条件即使同时成立也不一定就能产生死锁 。

3.规避死锁的方法

由于锁具有排他性并且锁只能够由其持有线程主动释放,因此由锁导致的死锁只能够从消除“占用并等待资源”和消除“循环等待资源”这两个方向入手 。

  • 粗锁法——使用粗粒度的锁代替多个锁。从消除“占用并等待资源”出发我们不难想到的一种方法就是,采用一个粒度较粗的锁来替代原先的多个粒度较细的锁,这样涉及的线程都只需要申请一个锁从而避免了死锁。 粗锁法的缺点是它明显地降低了并发性并可能导致资源浪费。
  • 锁排序法——相关线程使用全局统一的顺序申请锁。假设有多个线程需要申请资源(锁) {Lock1, Lock2. …, LockN},那么我们只需要让这些线程依照一个全局(相对于使用这种资源的所有线程而言)统一的顺序去申请这些资源,就可以消除“循环等待资源”这个条件,从而规避死锁。
  • 规避死锁的第3种方法是使用 ReentrantLock.tryLock(long,TimeUnit) 申请锁 。ReentrantLock.tryLock(long,TimeUnit)允许我们为锁申请这个操作指定一个超时时间。在超时时间内,如果相应的锁申请成功,那么该方法返回 true; 如果在tryLock(long,TimeUnit)执行的那一刻相应的锁正被其他线程持有,那么该方法会使当前线程暂停,直到这个锁被申请成功(此时该方法返回 true) 或者等待时间超过指定的超时时间(此时该方法返回false)。因此,使用tryLock(long,TimeUnit)来申请锁可以避免一个线程无限制地等待另外一个线程持有的资源,从而最终能够消除死锁产生的必要条件中的“占用并等待资源” 。
  • 一般地,一个方法在持有一个锁的情况下调用一个外部方法,而外部方法往往不在我们(开发人员)的控制范闱之内,其自身可能不会申请另外一个锁,也可能会申请另外一个锁。因此,在持有一个锁的情况下调用一个外部方法的代码很可能会间接导致死锁 。这种情况可以使用开放调用来规避。所谓开放调用 (Open Call) 就是一个方法在调用外部方法的时候不持有任何锁。显然,开放调用能够消除死锁产生的必要条件中的“持有并等待资源”。
  • 使用锁的替代品

4.死锁的恢复

死锁自动恢复的实际意义并不大。原因:

  • 死锁的自动恢复有赖于死锁的线程能够响应中断。
  • 自动恢复尝试可能导致新的问题。