前面我们在初识进程文末提到了一点点fork()函数创建子进程,但是没有详细地讲,在本文,我将详细地介绍一个进程的创建。等待以及终止是怎么样实现的。
创建进程
先认识两个重要的函数:
函数 | 功能 |
---|---|
fork | 创建子进程 |
vfork | 创建子进程 |
有人看到这笑了,这博主是傻吗?两个函数都是创建子进程,有啥区别呢?
别急,带我慢慢给你剖析。
(一) fork
fork()函数是Linux中一个非常重要的函数,它从一个已经存在进程中创建一个新进程,即子进程。
#include <unistd.h> //头文件
pid_t fork(void); //函数原型
返回值:子进程返回0,父进程返回子进程id,出错返回-1。
为什么子进程返回0?参考初识进程
看个例子:
1 #include <iostream>
2 #include <unistd.h>
3 #include <stdlib.h>
4
5 using namespace std;
6
7 int main()
8 {
9 pid_t fd = fork();
10 if(fd<0)
11 {
12 cout<<"fork false"<<endl;
13 exit(0);
14 }
15 if(fd == 0)
16 {
17 //child
18 while(1)
19 {
20 sleep(1);
21 cout<<"this is a proc,id is : "<< fd <<endl;
22 }
23 }
24 else{ //parent
25 while(1)
26 {
27 cout << "this is parent,id is :" << getpid() <<endl;
28 sleep(2);
29 }
30 }
31 return 0;
32 }
从结果来看,我们是有两个进程在一起运行。那么,当进程调用fork() 之后,内核是怎么做的呢?
- 分配新的内存块和内核数据结构给子进程
- 将父进程部分数据结构内容拷贝到子进程
- 添加子进程到系统进程列表中
- fork返回,开始调度器调度
看张图理解下:
fork之后就有两个二进制代码相同的进程,并且他们都运行到相同的地方,但他们是相互独立的,各自有各自的数据,只是代码段共享
上面的代码就能够说明问题。
fork用法
- 一个父进程想要复制自己,使父子进程同时执行不同的代码段。例如:在聊天系统中,父进程等待客户端请求,让子进程处理请求。
- 一个进程要执行一个不同的程序。例如,子进程从fork返回后,调用exec函数。
调用失败
- 当前程序已经有了很多子进程,毕竟内存有限,每个进程都是独立的,必定要占用一定资源,很好理解
- 实际用户的进程数超出了限制
另外,fork之后采用的是写时拷贝
看段代码:
1 #include <iostream>
2 #include <unistd.h>
3 #include <stdlib.h>
4
5 using namespace std;
6 //定义一个全局变量
7 int i = 10;
8
9 int main()
10 {
11 pid_t fd = fork();
12 if(fd<0)
13 {
14 cout<<"fork false"<<endl;
15 exit(0);
16 }
17 if(fd == 0)
18 {
19 //child
20 while(1)
21 {
22 sleep(1);
23 i = 20;
24 cout<< "i = "<< i << endl; //这里的 i 有时多少?
25 cout<<"this is a proc,id is : "<< fd <<endl;
26 }
27 }
28 else{ //parent
29 while(1)
30 {
31 i = 30;
32 cout<< " i= " << i <<endl; //这里的 i 是多少? 10?20?还是30?
33 cout << "this is parent,id is :" << getpid() <<endl;
34 sleep(2);
35 }
36 }
37 return 0;
38 }
很明显,这里他把我们的全局变量i修改成了两个值,这就是写时拷贝(COW)。
我们知道,fork创建的子进程共享父进程的资源,但他们有都是相互独立的,因此,在他们各自的代码中,所做的工作也是互不影响的。
并且 ,在Linux当中我们看到的地址都是虚拟地址,因此,如果我们要打印各自的地址的话,会发现他们地址都是相同的,很好理解,子进程复制了父进程的虚拟地址空间(MMU),打印出来的地址当然是一样的了,但是,当他们要修改一个变量的值的时候,OS就会给他们分配相应的物理地址。
vfork
vfork 也是用来创建子进程,但是,
- vfork创建子进程,父子进程共享地址空间,但是fork出来的子进程具有独立的地址空间
- vfork保证子进程优先执行,在执行exec或者exit之后才能调度父进程,而fork确实优先执行父进程。
很简单,就不举例,感兴趣自己写一个。
进程等待
方法 | 函数原型 | 返回值 | 参数 |
---|---|---|---|
wait | pid_t wait(int* status) | 成功返回等待进程pid,失败返回-1 | 输出型参数,获取进程退出状态,不关心可设置为NULL |
waitpid
pid_t waitpid(pid_t pid , int* status, int options)
参数:
pid:
pid = -1 ,等待任意子进程,与wait相同
pid > 0 等待其进程ID与pid相等的子进程
status:
WIFEXITED 如果子进程正常终止,即调用exit(3)或exit(2),或从main()返回,则返回true。
WEXITSTATUS 返回子进程的退出状态只有当WIFSIGNALED返回true时,才应该使用这个宏。
WIFSIGNALED 如果子进程被信号终止,则返回true。
WTERMSIG 返回导致子进程终止的信号的数量。只有当WIFSIGMALED返回true时,才应该使用这个宏。
WCOREDUMP 如果子进程生成核心转储,则返回true。
options:
WNOHANG 如果没有pid指定的子进程立即返回,正常结束,则返回该进程id
返回值:
正常返回则收集waitpid等待的子进程id
如果选项设置了WNOHANG,并且waitpid没有发现可以收集的pid则返回0,
出错返回-1 ,并且将error设置为对应错误码。
注意事项:
- 如果子进程已经退出,调用wait/waitpid会立即返回,并且释放资源,获得子进程退出信息
- 如果在任意时刻调用wait/waitoid,并且子进程正在运行或者没有退出,则进程可能阻塞
- 如果子进程不存在,则立即出错返回
获取子进程status
- 如果传NULL,则表示不关心子进程退出状态
- status不能简单地看成int ,而应该看作是位图(只研究status地16位),具体看下图
为什么要有wait/waitpid?
- 前面我们说过,fork一个子进程,如果子进程退出,父进程不管不顾会造成僵尸状态,最后造成内存泄漏
- 进程一旦变成了僵尸进程,就连强大的 kill -9 也挽回不了,毕竟要怎么杀死一个已经死掉的进程呢,难道要林正英出来制服?
- 一个程序结束我们应该要知道父进程交给子进程的任务完成的怎么样
- 父进程通过进程等待,回收子进程资源,获取子进程退出信息
进程等待相关代码
看看结果:
进程终止
常见进程终止的情况
- 代码跑完结果正确
- 代码跑完结果不正确
- 代码还没跑完进程就退出了,很明显,这是出错了
进程终止方法
正常终止:可以用 $?查看退出码
-
从main函数返回
-
调用exit函数
-
调用_exit
异常终止 -
Ctrl C 终止信号(SIGINT)
介绍两个函数:
(1)exit
#include <unistd.h>
void exit(int status);
参数:status定义了进程终止状态,可以通过父进程 wait() 获得
(2)_exit
#include <unistd.h>
void _exit(int status);
参数:status定义了进程终止状态,可以通过父进程 wait() 获得,
这里需要注意的是,虽然status是 int 类型,但是只用了低八位,所以在用$?查看退出码时会发现退出码是255。
两个函数调用过程:
从图中可以看出,exit最后也会调用_exit函数,但是在调用之前,还做了其他工作:
- 执行用户自定义清理函数(on_exit 或 atexit)
- 关闭所有的流比如输入输出流,刷新缓冲区
- 调用_exit