首先,我们构造一个死锁场景。
如何构造一个死锁呢?
很简单,只要让线程1占有对象a的锁后,再去请求对象b的锁。与此同时,对象2已经占有了对象b的锁,再请求对象a的锁。线程1与线程2互相等待,形成了死锁。(在面试中,也会被经常地要求手写死锁)
代码如下:
package com.example.dl; import org.springframework.web.bind.annotation.RequestMapping; import org.springframework.web.bind.annotation.RestController; @RestController public class Controller { @RequestMapping("/test") public String testDeadLock() { final Object a = new Object(); final Object b = new Object(); new Thread(() -> { synchronized (a) { System.out.println(Thread.currentThread().getName() + "占有了对象a的锁"); try { Thread.sleep(1000); } catch (InterruptedException e) { e.printStackTrace(); } System.out.println(Thread.currentThread().getName() + "请求对象b的锁"); synchronized (b) { System.out.println(Thread.currentThread().getName() + "占有了对象b的锁"); } } }, "Thread 1").start(); new Thread(() -> { synchronized (b) { System.out.println(Thread.currentThread().getName() + "占有了对象b的锁"); try { Thread.sleep(1000); } catch (InterruptedException e) { e.printStackTrace(); } System.out.println(Thread.currentThread().getName() + "请求对象a的锁"); synchronized (a) { System.out.println(Thread.currentThread().getName() + "占有了对象a的锁"); } } }, "Thread 2").start(); return "success"; } }
输出如下:
如果不施加干预,两个线程将会一直僵持着。
这个只是一个简单的死锁场景,如果线上发生这样的情况,该去如何定位呢?
我们把死锁代码放进一个简单的SpringBoot中
使用mvn install打包后,将打好的jar包放进我们实验的机器中,我的项目名称就叫做dl
使用nohup java -jar dl-0.0.1-SNAPSHOT.jar & 部署运行
使用curl http:port/test调用接口,不出意外的话,现在程序发生了死锁。
首先获取到该java应用的进程,ps -ef | grep dl | grep -v grep,获取到pid为12156
接着打印出该进程下线程的状态,并输出到dl.txt中,jstack 12156 > dl.txt
jstack可以用来生成虚拟机当前的线程快照,快速定位多线程使用不当引发的问题。
在该txt文件的末尾,我们可以看到以下的内容:
Found one Java-level deadlock: ============================= "Thread 2": waiting to lock monitor 0x00007f9ea8006008 (object 0x00000000e367d550, a java.lang.Object), which is held by "Thread 1" "Thread 1": waiting to lock monitor 0x00007f9ea8003f08 (object 0x00000000e367d560, a java.lang.Object), which is held by "Thread 2" Java stack information for the threads listed above: =================================================== "Thread 2": at com.example.dl.Controller.lambda$testDeadLock$1(Controller.java:40) - waiting to lock <0x00000000e367d550> (a java.lang.Object) - locked <0x00000000e367d560> (a java.lang.Object) at com.example.dl.Controller$$Lambda$469/1627217364.run(Unknown Source) at java.lang.Thread.run(Thread.java:748) "Thread 1": at com.example.dl.Controller.lambda$testDeadLock$0(Controller.java:25) - waiting to lock <0x00000000e367d560> (a java.lang.Object) - locked <0x00000000e367d550> (a java.lang.Object) at com.example.dl.Controller$$Lambda$468/117875601.run(Unknown Source) at java.lang.Thread.run(Thread.java:748) Found 1 deadlock.
可以清晰的看到,Thread 2请求一把被Thread 1占有的锁,而Thread 1请求一把被Thread 2占有的锁,这样就构成了死锁。
当然,这个场景非常的简单,但是线上环境错综复杂,在接口响应越来越慢、cpu负载越来越高的时候,可以使用jstack命令,查看java进程内线程的状态,看是否有死循环、死锁等。
然后根据具体情况具体分析,比方说按照顺序获得对象的锁,只能是从a到b的顺序,线程1获取a对象的锁后,尝试去获取b对象的锁时,线程2想要直接获取b对象的锁,则首先要获取对象a的锁,从而被线程1阻塞,等到线程1运行结束,释放所有的锁后,线程2才可以继续运行。
或者说超时直接放弃,换synchronized为ReentranLock,使用其带有时间的tryLock方法,一定时间内获取不到锁,直接放弃本次对锁的申请。