基础设施

HotSpot VM并发的基础设施主要是原子操作、ParkEvent和Parker,后面两个功能的重合度很高,未来可能合并为一个ParkEvent。在笔者写这本书的时候(jdk-12+31),它们两个还是独立的个体,所以文中会分别讨论。

原子操作

原子操作即普通意义上的不可打断的操作。HotSpot VM的原子模块位于runtime/atomic,它实现了原子性的递增值、交换值、比较并交换等操作,其底层实现依赖于CPU指令。举个例子,x86提供lock指令前缀,以保证一个CPU在执行被修饰的指令期间互斥地拥有对应的Cache Line的所有权。这个保证是并发的基础,并发离不开线程,线程离不开锁,如果多个线程在同一时刻抢锁(互斥量/同步量),锁内部就必须有一条只能互斥执行的代码,这便是原子指令。

ParkEvent

使用ParkEvent可以使线程睡眠与唤醒。一个ParkEvent与一个线程的生命周期绑定,当线程结束时,ParkEvent会移到一个EventFreeList链表,而新创建的线程会在EventFreeList中查找ParkEvent,如果没有就分配新的ParkEvent。ParkEvent本身只有分配和释放接口,但是它继承了平台相关的PlaformEvent,因此它就有了PlatformEvent提供的park、unpark接口,如代码清单6-9所示:

代码清单6-9 POSIX PlatformEvent的实现

void os::PlatformEvent::park() {
// CAS递减_event的值
int v;
for (;;) {
v = _event;
if (Atomic::cmpxchg(v - 1, &_event, v) == v) break;
}
if (v == 0) {
int status = pthread_mutex_lock(_mutex);
// 阻塞线程加一
++_nParked;
// 如果递减之后event为-1则阻塞,否则立刻返回
while (_event < 0) {
status = pthread_cond_wait(_cond, _mutex);
}
// 阻塞线程减一
--_nParked;
_event = 0;
status = pthread_mutex_unlock(_mutex);
OrderAccess::fence();
}
}void os::PlatformEvent::unpark() {
// 如果_event大于等于0,则设置为1并返回
if (Atomic::xchg(1, &_event) >= 0) return;
// 仅当_event为-1时,即另一个线程阻塞住时才执行后面的唤醒另一个线程的操作
int status = pthread_mutex_lock(_mutex);
int anyWaiters = _nParked;
status = pthread_mutex_unlock(_mutex);
if (anyWaiters != 0) {
status = pthread_cond_signal(_cond);
}
}

ParkEvent依赖的假设是它只被当前绑定的线程park,但是允许多个线程unpark。了解Windows的读者都知道,Windows内核有可以作为同步工具的Event内核对象。当一个操作完成时,可以将Event对象设置为触发状态,此时等待Event事件的线程将得到通知。ParkEvent在Windows上是通过Event内核对象实现的,由于内核的原生支持,其实现也比POSIX简单不少,如代码清单6-10所示:

代码清单6-10 Windows PlatformEvent的实现

void os::PlatformEvent::park() {
int v;
for (;;) {v = _Event;
if (Atomic::cmpxchg(v-1, &_Event, v) == v) break;
}
if (v != 0) return;
while (_Event < 0) {
DWORD rv = ::WaitForSingleObject(_ParkHandle, INFINITE);
}
_Event = 0;
OrderAccess::fence();
}
void os::PlatformEvent::unpark() {
if (Atomic::xchg(1, &_Event) >= 0) return;
::SetEvent(_ParkHandle);
}

ParkEvent广泛应用于HotSpot VM内部,实现synchronized同步代码块、对象锁语意以及JVM内部用的Mutex等功能,更多关于它的内容将在本章后面提到。

Parker

除了ParkEvent,HotSpot VM还有个与之功能重合的Parker,如代码清单6-11所示:

代码清单6-11 Parker

void Parker::park(bool isAbsolute, jlong time) {
// 如果count为1,当前park调用直接返回
if (Atomic::xchg(0, &_counter) > 0) return;
...
if (time == 0) {
_cur_index = REL_INDEX;
status = pthread_cond_wait(&_cond[_cur_index], _mutex);
}
else {
// 如果时间不为零,根据isAbsolute来选择毫秒还是微秒
_cur_index = isAbsolute ? ABS_INDEX : REL_INDEX;
status = pthread_cond_timedwait(...);
}
_cur_index = -1;
_counter = 0;
status = pthread_mutex_unlock(_mutex);
OrderAccess::fence();
...
}
void Parker::unpark() {
int status = pthread_mutex_lock(_mutex);
const int s = _counter;
_counter = 1;
int index = _cur_index;status = pthread_mutex_unlock(_mutex);
// 线程肯定是park的,唤醒它;对于没有park的线程,调用unpark是安全的,因为此时unpark
// 只会把counter设置为可获得然后返回。
if (s < 1 && index != -1) {
status = pthread_cond_signal(&_cond[index]);
}
}

Parker的核心是_counter值的变化,_coutner也叫permit。如果permit可获得(为1),那么调用park的线程立刻返回,否则可能阻塞。调用unpark使permit可获得;调用park使permit不可获得。与之不同的是,信号量(Semaphore)的permit可以累加,而Parker只有可获得、不可获得两种状态,它可以被看作受限的信号量。

Parker主要用于实现JSR166的并发组件。之前提到过JDK有个Unsafe类,该类允许Java层做一些底层的工作,如插入内存屏障,Parker也是通过Unsafe类暴露API的,如代码清单6-12所示:

代码清单6-12 Unsafe.park/Unsafe.unpark

public final class Unsafe {
/**
* 对调用了park的指定线程解除阻塞。如果指定线程没有调用park,即没有阻塞,
* 那么当前调用unpark会导致下一次调用park线程的线程不阻塞。
* 注意,该操作是不安全的,因为它必须确保指定线程没有销毁,通常在Java层调
* 用时不需要关心这个问题,但是在native code调用的时候需要。* @param thread 需要解除阻塞(park)状态的线程
*/
@HotSpotIntrinsicCandidate
public native void unpark(Object thread);
/**
* 阻塞当前线程,直到unpark被调用才解除。如果调用park前已经调用过unpark
* 那么park立即返回。如果当前线程已经中断,也立即返回。如果absolute
* 为false且time不为0,那么当过了指定的微秒时间后park立即返回。如果
* absolute为true且time不为0,那么当过了指定的毫秒时间后park立即返
* 回。如果操作系统伪唤醒,park也立即返回。该操作之所以放到Unsafe类里只是
* 因为unpark也在这里,把它放在其地方比较奇怪。
*/
@HotSpotIntrinsicCandidate
public native void park(boolean isAbsolute, long time);
...
}

注释描述的所有行为都和Parker源码一致。不过Unsafe.park/Unsafe.unpark不会被java.util.concurrent(JUC)的并发组件直接调用,而是会被JUC的LockSupport简单包装后再调用,如代码清单6-13所示:

代码清单6-13 LockSupport

package java.util.concurrent.locks;public class LockSupport {
private static final Unsafe U = Unsafe.getUnsafe();
public static void park(Object blocker) {
Thread t = Thread.currentThread();
setBlocker(t, blocker);
U.park(false, 0L);
setBlocker(t, null);
}
public static void unpark(Thread thread) {
if (thread != null)
U.unpark(thread);
}
...
}

JUC的“基石”——
AbstractQueuedSynchronizer就使用了LockSupport,并以此构造出整个JUC体系。除此之外,LockSupport也被ConcurrentHashMap、ForkJoinPool、StampedLock等JUC组件直接使用,具体请参见JDK中的JUC类库源码。

Monitor

HotSpot VM内部的并发主要依赖包装了ParkEvent并高度优化的Monitor。Monitor是一个复杂的实现,如代码清单6-14所示:

代码清单6-14 Monitor实现细节class Monitor :

public CHeapObj<mtInternal> {
protected:
SplitWord _LockWord ; // 竞争队列(cxq)
Thread * volatile _owner; // 锁的owner
ParkEvent * volatile _EntryList ; // 等待线程列表
ParkEvent * volatile _OnDeck ; // 假定继承锁的线程
volatile intptr_t _WaitLock [1] ; // 保护_WaitSet
ParkEvent * volatile _WaitSet ; // 等待集合
volatile bool _snuck; // 用于sneaky locking
char _name[MONITOR_NAME_LEN]; // Monitor名称
...
};

为了追求性能和可扩展性的平衡,Monitor实现了fast/slow惯例。在fast路径时,线程会原子性地修改Lock_Word中的Lock_Byte,如果没有线程竞争Monitor,则线程成功加锁,否则进入slow路径。

slow路径的设计思想围绕扩展性。Monitor为锁竞争的线程准备了cxq和EntryList两个队列,并包含了OnDeck和owner两种锁状态。最近达到的线程会进入cxq,owner表示持有当前锁的线程,OnDeck是由owner选择的、作为继承者将要获取到锁的线程。同时,owner也负责将EntryList的线程移动到OnDeck,如果EntryList为空,那么owner会将cxq的所有线程移动到EntryList。

就效率来说,slow路径也是同样优秀的。它会限制并发获取锁的线程数目。比如把GC线程放入WaitSet,当条件成立后GC线程不会立即唤醒竞争锁,因为Monitor会将WaitSet转移到cxq中。另外,位于cxq和EntryList中的阻塞态线程也不允许竞争锁。因此,任何时候只有三类线程可以竞争锁:OnDeck、刚释放锁的owner和刚到达但是未被放入cxq的线程。

LockWord是一个机器字,它可以表示cxq,存放线程指针作为一个竞争队列,也可以作为一个整型变量扮演锁的角色。线程加锁、解锁实际上是将cxq最低有效字节(LSB,Least Significant Byte)分别置0、置1。Monitor的加锁、解锁过程比较复杂,其加锁逻辑如代码清单6-15所示:

代码清单6-15 Monitor::ILock

void Monitor::ILock(Thread * Self) {
// 尝试获取cxq锁,如果没加锁(没竞争)则快速加锁并结束
if (TryFast()) {
Exeunt:
return;
}
// 否则有竞争
ParkEvent * const ESelf = Self->_MutexEvent;
if (TrySpin(Self)) goto Exeunt;
ESelf->reset();
OrderAccess::fence();
// 尝试获取cxq锁,如果成功则结束,否则将Self线程放入cxq
if (AcquireOrPush(ESelf)) goto Exeunt;// 任何时刻只有一个线程位于OnDeck,如果Self线程没有位于OnDeck,那么阻塞等待
while (OrderAccess::load_acquire(&_OnDeck) != ESelf) {
ParkCommon(ESelf, 0);
}
// 此时Self位于OnDeck,直到获取到锁,否则它一直待在OnDeck
for (;;) {
if (TrySpin(Self)) break;
ParkCommon(ESelf,0);
}
_OnDeck = NULL;
goto Exeunt;
}

假设有多条线程同时调用Monitor::ILock,只有一条线程成功执行CAS,将cxq锁的LSB置为1,当其他线程发现竞争后,CAS失败表示发现锁存在竞争,进入竞争逻辑。

竞争逻辑是一个复杂且漫长的过程。线程先入cxq,然后阻塞,当它们被唤醒后会先检查自己是否在OnDeck,如果没有则再次阻塞。如果在OnDeck中,除非抢到锁才能退出去,否则一直待在OnDeck中。解锁更为复杂,不仅需要解除锁定,还需要寻找下一个待解锁的线程,如代码清单6-16所示:

代码清单6-16 Monitor::IUnlock

void Monitor::IUnlock(bool RelaxAssert) {// 将LSB置为0,释放cxq锁
OrderAccess::release_store(&_LockWord.Bytes[_LSBINDEX], 0);
OrderAccess::storeload();
// 如果OnDeck不为空,唤醒OnDeck线程
ParkEvent * const w = _OnDeck;
if (w != NULL) {
if ((UNS(w) & _LBIT) == 0) w->unpark();
return;
}
// OnDeck为空,如果cxq和EntryList都为空,没有Unlock的线程,直接退出
intptr_t cxq = _LockWord.FullWord;
if (((cxq & ~_LBIT)|UNS(_EntryList)) == 0) {
return;
}
// 如果在第一行代码(释放cxq)到此处期间有线程获取到锁,那么当前Unlock返回
// 寻找Succession的任务并交给那个线程
if (cxq & _LBIT) {
return;
}
// 寻找Succession(寻找下一个放到OnDeck做Unlock的线程)
Succession:
if (!Atomic::replace_if_null((ParkEvent*)_LBIT, &_OnDeck)) {
return;
}
// 如果EntryList不为空,则将第一个元素从EntryList放入OnDeck
ParkEvent * List = _EntryList;if (List != NULL) {
WakeOne:
ParkEvent * const w = List;
_EntryList = w->ListNext;
OrderAccess::release_store(&_OnDeck, w);
OrderAccess::storeload();
cxq = _LockWord.FullWord;
if (cxq & _LBIT) return;
w->unpark();
return;
}
// 否则EntryList为空
cxq = _LockWord.FullWord;
if ((cxq & ~_LBIT) != 0) {
// 从cxq获取元素,放到EntryList
for (;;) {
// 如果从第一行解释代码到此处有其他线程加锁了,
// 则寻找Succession的任务并交给那个线程
if (cxq & _LBIT) goto Punt;
intptr_t vfy = Atomic::cmpxchg(...);
if (vfy == cxq) break;
cxq = vfy;
}
// 否则从cxq拿出线程放入EntryList,然后把那个线程从EntryList拿出
// 放到OnDeck,并唤醒
_EntryList = List = (ParkEvent *)(cxq & ~_LBIT);
goto WakeOne;}
Punt:
_OnDeck = NULL;
OrderAccess::storeload();
cxq = _LockWord.FullWord;
if ((cxq & ~_LBIT) != 0 && (cxq & _LBIT) == 0) {
goto Succession;
}
return;
}

之前假设了多个线程执行Monitor::ILock,其中一个成功加锁并继续执行代码,其他线程都阻塞并等待自己被放入OnDeck。结合之前的场景,IUnlock先将LSB置为0释放cxq锁。如果OnDeck存在线程则解除阻塞。如果OnDeck为空但是EntryList存在线程,则将第一个元素从EntryList移到OnDeck,再解除锁定。如果EntryList为空但是cxq不为空,这和我们假设的情景一致,此时将cxq的线程移动到EntryList,然后再将EntryList的线程放入OnDeck,最后解除锁定。

回想条件等待的一般情景:首先线程抢锁,抢到锁后线程进入等待队列然后释放锁,接着立刻阻塞等待。线程可能因为被其他线程通知,或者等待超时,或者伪唤醒而解除等待状态,此时如果要接着执行wait()后面的代码,需要线程能再次抢到外部的锁。

Monitor::IWait()的实现与上述场景大致相同,只是多了些细节,如代码清单6-17所示:

代码清单6-17 Monitor::IWait

int Monitor::IWait(Thread * Self, jlong timo) {
// 执行wait的线程必须已经获得了锁
assert(ILocked(), "invariant");
ParkEvent * const ESelf = Self->_MutexEvent;
ESelf->Notified = 0;
ESelf->reset();
OrderAccess::fence();
// 将Self线程加入等待集合
Thread::muxAcquire(_WaitLock, "wait:WaitLock:Add");
ESelf->ListNext = _WaitSet;
_WaitSet = ESelf;
Thread::muxRelease(_WaitLock);
// 释放外部的锁(即执行wait前加的锁)
IUnlock(true);
// 线程阻塞等待,直到收到另一个线程的通知,或者超时唤醒,或者伪唤醒
for (;;) {
if (ESelf->Notified) break;
int err = ParkCommon(ESelf, timo);
if (err == OS_TIMEOUT) break;
}
OrderAccess::fence();
// 现在线程从wait状态唤醒了,需要将它移出等待集合WaitSetint WasOnWaitSet = 0;
if (ESelf->Notified == 0) {
Thread::muxAcquire(_WaitLock, "wait:WaitLock:remove");
if (ESelf->Notified == 0) {
ParkEvent * p = _WaitSet;
ParkEvent * q = NULL;
while (p != NULL && p != ESelf) {
q = p;
p = p->ListNext;
}
if (p == _WaitSet) {
_WaitSet = p->ListNext;
} else {
q->ListNext = p->ListNext;
}
WasOnWaitSet = 1;
}
Thread::muxRelease(_WaitLock);
}
// 尝试重新获取锁
if (WasOnWaitSet) {
// 如果Self线程是因为wait超时被唤醒,那么它还在等待集合里面,可直接获得锁
ILock(Self);
} else {
// 否则Self线程是因为其他线程通知而被唤醒,尝试抢锁,抢不到就阻塞等待
for (;;) {if (OrderAccess::load_acquire(&_OnDeck) == ESelf
&& TrySpin(Self)) break;
ParkCommon(ESelf, 0);
}
_OnDeck = NULL;
}
// 醒来后可继续执行的线程必须抢到了外部锁
assert(ILocked(), "invariant");
return WasOnWaitSet != 0;
}

最全学习笔记:大厂真题+微服务+MySQL+分布式+SSM框架+Java+Redis+数据结构与算法+网络+Linux+Spring全家桶+JVM+高并发+各大学习思维脑图+面试集合