I/O模型

标签(空格分隔): 计算机网络


1. 五大I/O模型

一个套接字输入操作包含两个阶段:

  • 等待数据准备好(从网络中到达TCP缓存)
  • 将数据从内容复制到用户进程(从接收的内核数据复制到进程缓冲区中)

1.1 同步阻塞I/O

revfrom调用,进程阻塞,等待数据准备好为阻塞,将数据复制到进程为阻塞,直到结束才返回。
第一阶段阻塞,第二阶段同步。
IOModle-1.png-28kB

1.2 同步非阻塞I/O

revfrom调用,内核返回一个错误码表示数据还未准备好,过段时间再调用直到数据准备就绪,将数据从内核复制到进程为阻塞,结束时返回。
第一阶段非阻塞,第二阶段同步。

IOModle-2.png-47kB

1.3 I/O复用

用select、poll、epoll等待数据准备就绪,在数据准备就绪时进行recvfrom系统调用,将数据从内核复制到进程为阻塞,结束时返回。
后面详细讲。
IOModle-3.png-43kB

1.4 信号驱动模型

sigaction系统调用,内核立即返回,进程可以继续执行,直到数据准备就绪时给进程一个信号,进程便进行revfrom系统调用,将数据从内核复制到进程为阻塞,结束时返回。
第一阶段非阻塞,第二阶段同步。

IOModle-4.png-41kB

1.5 异步I/O

aio_read调用内核会立即返回,进程继续执行,不会被阻塞,而当数据准备好并也已经复制完毕时会向进程发送信号,整个过程非阻塞,异步。
第一阶段非阻塞,第二阶段异步。

IOModle-5.png-33kB

1.6 总结

IOModle-6.png-46kB


2. I/O复用模型

2.1 select、poll

2.1.1 select执行过程

select方法会阻塞进程,并将其注册的全部描述符从进程拷贝到内核中去,在注册的描述符中如果有事件触发则返回,返回中没有声明哪些描述符准备好了,返回值大于1时进程将轮询这些描述符找出I/O事件触发的描述符并对其进行处理。

2.1.2 poll执行过程

和select完全一致

2.1.3 select和poll的区别

  • select的描述符是用数组实现的,大小默认为1024,即能监听1024个描述符,如果要监听更多的话就需要修改数组大小并重新编译;epoll用链表实现,大小没有限制。

  • select的阻塞超时是ns单位,支持实时;poll则是ms

  • select支持的事件类型没有poll多,poll对描述符的重复利用比select高

  • select、poll本身是阻塞的,但是其注册描述符(套接字)不是阻塞的,如果阻塞则违背初衷,所以整个过程,还是阻塞的,只不过阻塞的对象不一样,第一阶段是select,第二阶段是recvfrom

2.2 epoll

2.2.1 执行过程

epoll_ctl()用于向内核注册新的描述符或者是改变某个文件描述符的状态,已注册的描述符在内核中会被维护在一棵红黑树上,通过回调函数内核会将 I/O 准备好的描述符加入到一个链表中管理,进程调用epoll_wait()便可以得到事件完成的描述符。

2.2.2工作模式

LT 模式

当 epoll_wait() 检测到描述符事件到达时,将此事件通知进程,进程可以不立即处理该事件,下次调用 epoll_wait() 会再次通知进程。是默认的一种模式,并且同时支持 Blocking 和 No-Blocking。

ET 模式

和 LT 模式不同的是,通知之后进程必须立即处理事件,下次再调用 epoll_wait() 时不会再得到事件到达的通知。很大程度上减少了 epoll 事件被重复触发的次数,因此效率要比 LT 模式高。只支持 No-Blocking,以避免由于一个文件句柄的阻塞读/阻塞写操作把处理多个文件描述符的任务饿死。

2.2.3 select、poll和epoll的区别

从执行过程的描述可以看出,epoll 只需要将描述符从进程缓冲区向内核缓冲区拷贝一次;并且进程不需要通过轮询来获得事件完成的描述符。

2.3 应用场景

2.3.1 select 应用场景

select 的 timeout 参数精度为 1ns,而 poll 和 epoll 为 1ms,因此 select 更加适用于实时性要求比较高的场景,比如核反应堆的控制。

2.3.2 poll 应用场景

poll 没有最大描述符数量的限制,如果平台支持并且对实时性要求不高,应该使用 poll 而不是 select。

2.3.3 epoll 应用场景

需要监控的描述符状态变化多,而且都是非常短暂的,也没有必要使用 epoll。因为 epoll 中的所有描述符都存储在内核中,造成每次需要对描述符的状态改变都需要通过 epoll_ctl() 进行系统调用,频繁系统调用降低效率。并且 epoll 的描述符存储在内核,不容易调试。

需要同时监控小于 1000 个描述符,就没有必要使用 epoll,因为这个应用场景下并不能体现 epoll 的优势。

3. 参考资料: