1. 线程

有的进程可能需要同时做很多事,而传统的进程只能串行地执行一系列程序,为此引入了线程概念来增加并发度

传统的进程是程序执行流的最小单位,引入线程之后,线程成为了程序执行流的最小单位

可以把线程理解为轻量级线程,线程是一个基本的CPU执行单元,也是程序执行流的最小单位。引入线程之后,不仅是进程之间可以并发,进程内的各线程之间也可以并发,从而进一步提升了系统的并发度,使得一个进程内也可以并发处理各种任务。

引入线程之后,进程只作为除了CPU之外的系统资源的分配单元。

1.1 引入线程机制后带来的变化

Fig 1. 线程带来的变化

1.2 线程的属性

  • 线程是处理机调度的单位
  • 多CPU计算机种,各个线程可以占用不同的CPU
  • 每个线程都有一个线程ID、线程控制块TCB
  • 线程也有就绪、阻塞、运行三种基本状态
  • 线程几乎不拥有系统资源
  • 同一个进程的不同线程间共享进程的资源
  • 由于共享内存地址空间,同一进程种的线程间的通信甚至无需系统干预
  • 同一进程中的线程切换,不会引起进程切换
  • 不同进程中的线程切换,会引起进程切换
  • 切换同进程内的线程,系统开销很小
  • 切换进程,系统开销很大

2. 线程的实现方式

2.1 用户级线程 —— User Level Thread, ULT

历史背景:早期的OS只支持进程,不支持线程,当时的线程是由线程库实现的

  • 用户级线程由应用程序通过线程库实现,所有的线程管理工作都由应用程序负责(包括线程切换)
  • 用户级线程中,线程切换可以在用户态下即可完成,无需操作系统干预
  • 在用户看来,并意识不到线程的存在,用户级线程就是从用户视角能看到的线程
  • 优点:用户级线程的切换在用户空间即可完成,不需要切换到核心态,线程管理的系统开销小,效率高
  • 缺点:当一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高,多个线程不可在多核处理机上并发运行

2.2 内核级线程 —— Kernel Level Thread, KLT

  • 内核级线程的管理工作由操作系统内核完成
  • 线程调度、切换等工作都由内核负责,因此内核级线程的切换必然需要在核心态下才能完成
  • 操作系统会为每个内核级线程建立相应的TCB,通过TCB对线程进行管理。内核级线程就是从OS内核角度能看到的线程
  • 优点:当一个线程被阻塞后,别的线程可以继续运行,并发能力强,多线程可以在多核处理机上并行执行
  • 缺点:一个用户进程会占用多核内核级线程,线程切换由操作系统内核完成,需要切换到核心态,因此线程管理的成本高,开销大

小结:
用户级线程是代码逻辑的载体,内核级线程是运行机会的载体,内核级线程才是处理机分配的单位。一段代码逻辑只有获得了运行机会才能被CPU执行

3. 多线程模型

3.1 一对一模型

Fig 2. 一对一模型

一个用户级线程映射到一个内核级线程,每个用户进程有用户级线程同数量的内核级线程。

  • 优点:当一个线程被阻塞后,别的线程还可以继续执行,并发能力强。多线程可以在多核CPU上并行执行。
  • 缺点:一个用户进程会占用多个内核级线程,线程切换由OS内核完成,需要切换到核心态,因此线程管理的成本高,开销大。

3.2 多对一模型

Fig 3. 多对一模型

多个用户级线程映射到一个内核级线程,且一个进程只被分配一个内核级进程

  • 优点:用户级线程切换在用户空间即可完成,不需要切换到核心态,线程管理的系统开销小,效率高
  • 缺点:当一个用户级线程被阻塞后,整个进程都被阻塞,并发度不高,多个线程不可以在多核CPU上并行运行

重点:操作系统只看得见内核级线程,因此只有内核级线程才是CPU分配的单位

3.3 多对多模型

Fig 4. 多对多模型

n个用户级线程映射到 m 个内核级线程(n >= m),每个用户进程对应 m 个内核 级线程。 克服了多对一模型并发度不高的缺点(一个阻塞全体阻塞),又克服了一对一模型中一个用线程库户进程占用太多内核级线程,开销太大的缺点。