I/O模型

标签（空格分隔）：计算机网络

1. 五大I/O模型

一个套接字输入操作包含两个阶段：

等待数据准备好（从网络中到达TCP缓存）
将数据从内容复制到用户进程（从接收的内核数据复制到进程缓冲区中）

1.1 同步阻塞I/O

revfrom调用，进程阻塞，等待数据准备好为阻塞，将数据复制到进程为阻塞，直到结束才返回。
第一阶段阻塞，第二阶段同步。
IOModle-1.png-28kB

1.2 同步非阻塞I/O

revfrom调用，内核返回一个错误码表示数据还未准备好，过段时间再调用直到数据准备就绪，将数据从内核复制到进程为阻塞，结束时返回。
第一阶段非阻塞，第二阶段同步。

IOModle-2.png-47kB

1.3 I/O复用

用select、poll、epoll等待数据准备就绪，在数据准备就绪时进行recvfrom系统调用，将数据从内核复制到进程为阻塞，结束时返回。
后面详细讲。
IOModle-3.png-43kB

1.4 信号驱动模型

用sigaction系统调用，内核立即返回，进程可以继续执行，直到数据准备就绪时给进程一个信号，进程便进行revfrom系统调用，将数据从内核复制到进程为阻塞，结束时返回。
第一阶段非阻塞，第二阶段同步。

IOModle-4.png-41kB

1.5 异步I/O

aio_read调用内核会立即返回，进程继续执行，不会被阻塞，而当数据准备好并也已经复制完毕时会向进程发送信号，整个过程非阻塞，异步。
第一阶段非阻塞，第二阶段异步。

IOModle-5.png-33kB

1.6 总结

IOModle-6.png-46kB

2. I/O复用模型

2.1 select、poll

2.1.1 select执行过程

select方法会阻塞进程，并将其注册的全部描述符从进程拷贝到内核中去，在注册的描述符中如果有事件触发则返回，返回中没有声明哪些描述符准备好了，返回值大于1时进程将轮询这些描述符找出I/O事件触发的描述符并对其进行处理。

2.1.2 poll执行过程

和select完全一致

2.1.3 select和poll的区别

select的描述符是用数组实现的，大小默认为1024，即能监听1024个描述符，如果要监听更多的话就需要修改数组大小并重新编译；epoll用链表实现，大小没有限制。
select的阻塞超时是ns单位，支持实时；poll则是ms
select支持的事件类型没有poll多，poll对描述符的重复利用比select高
select、poll本身是阻塞的，但是其注册描述符（套接字）不是阻塞的，如果阻塞则违背初衷，所以整个过程，还是阻塞的，只不过阻塞的对象不一样，第一阶段是select，第二阶段是recvfrom

2.2 epoll

2.2.1 执行过程

epoll_ctl()用于向内核注册新的描述符或者是改变某个文件描述符的状态，已注册的描述符在内核中会被维护在一棵红黑树上，通过回调函数内核会将 I/O 准备好的描述符加入到一个链表中管理，进程调用epoll_wait()便可以得到事件完成的描述符。

2.2.2工作模式

LT 模式

当 epoll_wait() 检测到描述符事件到达时，将此事件通知进程，进程可以不立即处理该事件，下次调用 epoll_wait() 会再次通知进程。是默认的一种模式，并且同时支持 Blocking 和 No-Blocking。

ET 模式

和 LT 模式不同的是，通知之后进程必须立即处理事件，下次再调用 epoll_wait() 时不会再得到事件到达的通知。很大程度上减少了 epoll 事件被重复触发的次数，因此效率要比 LT 模式高。只支持 No-Blocking，以避免由于一个文件句柄的阻塞读/阻塞写操作把处理多个文件描述符的任务饿死。

2.2.3 select、poll和epoll的区别

从执行过程的描述可以看出，epoll 只需要将描述符从进程缓冲区向内核缓冲区拷贝一次；并且进程不需要通过轮询来获得事件完成的描述符。

2.3 应用场景

2.3.1 select 应用场景

select 的 timeout 参数精度为 1ns，而 poll 和 epoll 为 1ms，因此 select 更加适用于实时性要求比较高的场景，比如核反应堆的控制。

2.3.2 poll 应用场景

poll 没有最大描述符数量的限制，如果平台支持并且对实时性要求不高，应该使用 poll 而不是 select。

2.3.3 epoll 应用场景

需要监控的描述符状态变化多，而且都是非常短暂的，也没有必要使用 epoll。因为 epoll 中的所有描述符都存储在内核中，造成每次需要对描述符的状态改变都需要通过 epoll_ctl() 进行系统调用，频繁系统调用降低效率。并且 epoll 的描述符存储在内核，不容易调试。

需要同时监控小于 1000 个描述符，就没有必要使用 epoll，因为这个应用场景下并不能体现 epoll 的优势。

3. 参考资料：

Stevens W R, Fenner B, Rudoff A M. UNIX network programming[M]. Addison-Wesley Professional, 2004.
CyC的CS-Notes的Socket篇