进程的缺点

(1)进程间切换的计算机资源开销很大,切换效率非常低

OS是通过虚拟内存机制来实现进程空间独立的,进程在并发运行时需要相互间的切换,切换时必然涉及虚拟内存机制的控制,但是虚拟内存机制比较复杂,所以在进行进程间切换时,会耗费CPU、cache、内存等计算机资源,也非常耗费切换时间。

(2)进程间数据共享的开销很大

当程序涉及多进程时,往往会涉及到进程间的通信,OS提供了各种各样的通信机制,由于进程空间的独立性,这些通信机制共同原理都是通过OS来转发进程间的数据,但是调用OS提供的这些通信机制的函数时,这些OS函数的运行也是需要消耗相当的计算机资源,同时也很耗费时间。

为什么线程效率高、开销低

线程的本质就是函数,线程间的切换本质是函数的切换,线程间通信与函数间的数据共享同理。
函数间通信有两种方式:

  1. 具有相互调用关系函数来说,使用函数传参来通信。
  2. 对于没有调用关系的函数来说,使用全局变量来通信。

线程自己独立的属性

  1. 每个线程拥有自己独立的线程ID(TID);
  2. 每个线程有独立的切换状态。当线程切换时,必须保存当前线程被中断的那条指令的地址,以便切换回来后还原现场,从中断处继续运行。
  3. 有自己独立的函数栈(线程栈)。函数栈的作用就是用来保存函数局部变量的;
  4. 自己独立的错误号。线程函数的错误号是独立的,所以线程函数出错时,错误号并不是通过设置errno实现的,而是直接将
    错误号返回;
  5. 每一个线程有自己独立的信号屏蔽字和未决信号集;
  6. 每个线程有自己独立的tack_struct结构体(存放线程的信息)。

线程库函数

  • 线程库和OS系统API的关系

线程库函数实际上也是封装OS的相应API来实现的,如果线程库运行在Linux这边的话,线程库其实就是通过调用Linux的clone()等系统函数实现的。

  • 一些注意事项
  1. gcc编译时,必须跟-pthread选项,因为像线程库这类的不常用库,gcc不会默认链接,需要明确指定链接,如果不指定链接,编译链接时会报找不到线程函数的错误。
  2. 次线程结束了,对整个进程没有任何影响,但是主线程代表了整个进程的存在,如果主线程结束了,整个进程也就结束了,进程都没了线程自然也没了,所以主线程一定不能死。
  3. c++/java的线程函数被注册为线程后不会立即启动,需要单独调用某个启动函数来启动,而c线程函数一旦被pthread_create注册为线程后会立即被启动运行。
  • 关于几个API

pthread_cancel A线程调用该函数来结束B线程,回收其资源
pthread_exit A线程调用该函数来结束自己
pthread_join A线程阻塞等待(未分离的)次线程结束,回收其资源
pthread_detach 如果次线程的资源不希望被别人调用pthread_join函数来回收,而是希望自己结束时自动回收,就可以调用这个函数。
pthread_cleanup_push   将处理函数地址压入线程栈
pthread_cleanup_pop  这个函数必须和pthread_cleanup_push 配对出现,就算这个函数调用不到也必须写,否则编译时不通过,如果线程还未执行到pthread_cleanup_pop,就被pthread_cancel或者pthread_exit,那么pthread_cleanup_pop会被自动触发。

  • 线程分离

方法有两种:①调用pthread_detach函数实现、②通过设置分离属性实现
具体步骤:
1° 定义pthread_attr_t attr来存放新属性;
2° 调用pthread_attr_init; 初始化一下attr结构体变量
3° 调用pthread_attr_setdetachstate(&attr, PTHREAD_CREATE_DETACHED);
4° 调动pthread_create创建线程时,将attr传递给pthread_create,将线程分离
5° pthread_attr_destroy删除属性设置

线程资源保护之互斥锁

  • 初始化互斥锁(快锁)有两种方法

第1种:使用pthread_mutex_init实现
第2种:直接初始化实现:
    pthread_mutex_t mutex = PTHREAD_MUTEX_INITIALIZER;
    其中,PTHREAD_MUTEX_INITIALIZER的宏值为{,,**,…}
为什么以下写法有错?
    pthread_mutex_t mutex;
    mutex = {*,*,*,…};
    因为这是在尝试给结构体变量进行整体赋值,而在C语言中,结构体变量是不能够整体赋值的,只能整体初始化,所以写法是错误的。
所以说:
    调用pthread_mutex_init函数来给mutex设置初始值时,实现的本质是结构体赋值。
    使用pthread_mutex_t mutex = PTHREAD_MUTEX_INITIALIZER方式给mutex设置初始值时,实现的本质是结构体初始化。

  • 有关PTHREAD_MUTEX_INITIALIZER宏

实际上除了这个宏外,还有两个宏,分别是:
    PTHREAD_ERRORCHECK_MUTEX_INITIALIZER_NP
    PTHREAD_RECURSIVE_MUTEX_INITIALIZER_NP

  • 三种互斥锁

PTHREAD_MUTEX_INITIALIZER,快速互斥锁(或叫阻塞互斥锁)。特点:

  • 加锁不成功是会阻塞,如果不想阻塞必须使用pthread_mutex_trylock来加锁,而不是pthread_mutex_lock。
  • 对于同一把快锁来说,不能多次加锁,否者会出错
  • 已经解锁的快锁也不能再次解锁,否者会出错

PTHREAD_ERRORCHECK_MUTEX_INITIALIZER_NP:检错互斥锁。特点:

  • 使用pthread_mutex_lock加锁时,如果加锁不成功不会阻塞,会直接出错返回。加锁不成功就直接错误返回,所以才被称为“检错互斥锁”。

PTHREAD_RECURSIVE_MUTEX_INITIALIZER_NP:递归互斥锁。特点:

  • 同一把锁可多次枷锁,每加一次锁,加锁次数就会加1
  • 解锁的顺序刚好与加锁顺序相反,每解锁一次,加锁次数就会减1。正是由于可以重复的加/解锁,所以才被称为递归加锁。

线程资源保护之信号量

信号量的使用步骤:
1)定义信号量集合
  用于互斥时,集合中只需要一个信号量。
  用于同步时,有几个线程需要同步,集合中就需要包含几个信号量
2)初始化集合中的每个信号量
  如果是用于互斥,基本都是设置为1
  如果是用于同步,具体问题具体分析

线程信号量与进程信号量使用上的区别:
1)初始化。
  线程信号量集合其实就是自定义的一个数组,而进程信号量集合则是通过semget函数创建的。我们只要把数组定义为全局变量,所有的线程即可共享使用,不像进程信号量,需要semid才能实现共享操作。
2)销毁
  对于进程信号量集合来说,只要删除一个信号量,整个集合即被删除,但是对于线程信号量来说,需要一个一个的删除,当所有信号量都删除完后,集合才被删除完毕。

  • 补充

sleep如果放在临界区,会导致互斥失败
pthrad_cond_wait = unlock->sleep->wake up->lock

多线程时是如何响应信号?

  1. 进程收到信号后,进程会找到某一个没有屏蔽该信号的线程去处理在这个信号找哪一个线程,由进程说了算。
  2. 如果所有的线程都屏蔽了该信号的话,信号发生时,进程会将未决信号记录到某个线程的“未决信号字”中。同样的,找哪一个线程,由进程说了算。
  3. 当线程收到进程判给它的信号后,而且如果该信号的处理方式还是捕获的话,这个线程在运行时会被中断,然后去执行信号捕获函数,当信号捕获函数执行完毕后,才会返回被中断的线程,接着执行。