原子性

  原子(Atomic)的字面意思是不可分割的(Indivisible)。对于涉及共享变量访问的操作,若该操作从其执行线程以外的任意线程来看是不可分割的,那么该操作就是原子操作,相应地我们称该操作具有原子性(Atomicity)。

  所谓“不可分割”,其中一个含义是指访问(读、写)某个共享变量的操作从其执行线程以外的任何线程来看,该操作要么已经执行结束要么尚未发生,即其他线程不会“看到”该操作执行了部分中间效果。

  这里举个例子:假设线程T1通过执行updateHostInfo方法来更新主机信息(HostInfo),线程T2则通过执行connentToHost方法来读取主机信息,并据此与相应的主机建立网络连接。那么,updateHostInfo方法中的操作(更新主机IP地址和端口号)必须是一个原子操作,即这个操作必须是“不可分割”的。否则,可能出现这样的情形:假设hostInfo的初始值表示的IP地址为“192.168.1.101”、端口号为8081的主机,T1执行updateHostInfo方法试图将hostInfo更新为IP地址为“192.168.1.100”、端口号为8080的主机的时候,T2可能刚好执行connentToHost方法,那么此时由于T1可能刚刚执行完语句①而未开始语句②(即只更新完IP地址而尚未更新端口号),因此T2可能读到的IP地址为“192.168.100”而端口号却任然为8081的主机信息,即T2读到了一个错误的主机信息(IP地址为“192.168.1.100”的主机上面并没有开启侦听端口8081,它开启的是8080),从而无法建立网络连接!这里的错误是由于updateHostInfo方法中的操作不是原子操作(不具备“不可分割”的特性)而使其他线程读取了脏数据(错误的主机信息)导致的。

public class AtomicityExample{
	
	private HostInfo hostInfo;
	
	updateHostInfo(String ip, int port){
		// 以下操作不是原子操作
		hostInfo.setIp(ip);//语句①
		
		hostInfo.setPort(port);//语句②
		
	}
	
	public void connectToHost(){
		String ip = hostInfo.getPort();

		int prot = hostInfo.getPort();

		connectToHost(ip, port);
	}
	
	private void connectToHost(String ip, int port){
		// ...
	}

	public static class HostInfo{
		private String ip;
		
		private int port;

		// ...
	}
}

  第二个含义就是,访问同一组共享变量的原子操作是不能够被交错的,这就排除了一个线程执行一个操作期间另外一个线程读取或者更新该操作所访问的共享变量而导致的干扰(读脏数据)和冲突(丢失更新)的可能。

可见性

  在多线程环境下,一个线程对某个共享变量进行更新之后,后续访问该变量的线程可能无法立刻读取到这个更新的结果,甚至永远也无法读取到这个更新的结果。这就是线程安全问题的另一个表现形式:可见性(Visibility)。

  如果一个线程对某个共享变量进行更新之后,后续访问该变量的线程可以读取到该更新的结果,那么我们就称这个线程对该共享变量的更新对其他线程可见,否则我们就称这个线程对共享变量的更新对其他线程不可见。可见性就是指一个线程对共享变量的更新的结果对于读取相应共享变量的线程而言是否可见的问题。多线程程序在可见性方面存在问题意味着某些线程读取到了旧数据(Stale Data),而这可能导致程序出现我们所不期望的结果。

  如果成员变量为了避免出现可见性问题,可以使用volatile关键字声明,保证多线程的可见性。volatile关键字所起到的一个作用就是,提示JIT编译器被修饰的变量可能被多个线程共享,以阻止JIT编译器做出可能导致程序运行不正常的优化。另外一个作用就是读取一个volatile关键字修饰的变量会使相应的处理器执行刷新处理器缓存的动作,写一个volatile关键字修饰的变量会使相应的处理器执行冲刷处理器缓存的动作,从而保障了可见性。

  可见性得以保障,并不意味着一个线程能够看到另外一个线程更新的所有变量的值。如果一个线程在某个时刻更新了许多个共享变量的值,那么此后其他线程再来读取这些变量时,这些线程所读取到的变量值有些是其他线程更新过的值,而有些则可能仍然是其他线程更新前的值(旧值)。

  可见性的保障仅仅以为着一个线程能够读取到共享变量的相对新址,而不能保障该线程能够读取到相应变量的最新值


关于相对新值的约定:

  对于同一个共享变量而言,一个线程更新了该变量的值之后,其他线程能够读取到这个更新后的值,那么这个值就称为该变量的相对新值。如果读取这个共享变量的线程在读取并使用该变量的时候其他线程无法更新该变量的值,那么该线程读取到的相对新值就被称之为该变量的最新值。

有序性

  有序性(Ordering)指在什么情况下一个处理器上运行的一个线程所执行的内存访问操作在另外一个处理器上运行的其他线程看来是乱序的(Out of order)。所谓乱序,是指内存访问操作的顺序看起来像是发生了变化。在了解有序性概念之前先要了解重排序的概念。

重排序的概念

  重排序划分为指令重排序和存储子系统重排序两种

重排序类型 重排序表现 重排序来源
指令重排序 程序顺序与源代码顺序不一致 编译器
执行顺序与程序顺序不一致 JIT编译器、处理器
存储子系统重排序 源代码顺序、程序顺序和执行顺序这三者保持一致,但是感知顺序与执行顺序不一致 高速缓存、写缓冲器
  • 源代码顺序(Source Code):源代码中所指定的内存访问操作顺序。
  • 程序顺序(Program Order):在给定处理器上运行的目标代码(Object Code)所指定的内存访问操作顺序。尽管Java虚拟机执行Java代码有两种方式:解释执行(被执行的是字节码Byte Code)和编译执行(被执行的是机器码)。
  • 执行顺序(Execution Order):内存访问操作在给定处理器上的实际执行顺序。
  • 感知顺序(Perceived Order):给定处理器所感知到(看到)的该处理器及其他处理器的内存访问操作发生的顺序。