I/O模型
标签(空格分隔): 计算机网络
1. 五大I/O模型
一个套接字输入操作包含两个阶段:
- 等待数据准备好(从网络中到达TCP缓存)
- 将数据从内容复制到用户进程(从接收的内核数据复制到进程缓冲区中)
1.1 同步阻塞I/O
revfrom
调用,进程阻塞,等待数据准备好为阻塞,将数据复制到进程为阻塞,直到结束才返回。
第一阶段阻塞,第二阶段同步。
1.2 同步非阻塞I/O
revfrom
调用,内核返回一个错误码表示数据还未准备好,过段时间再调用直到数据准备就绪,将数据从内核复制到进程为阻塞,结束时返回。
第一阶段非阻塞,第二阶段同步。
1.3 I/O复用
用select、poll、epoll等待数据准备就绪,在数据准备就绪时进行recvfrom
系统调用,将数据从内核复制到进程为阻塞,结束时返回。
后面详细讲。
1.4 信号驱动模型
用sigaction
系统调用,内核立即返回,进程可以继续执行,直到数据准备就绪时给进程一个信号,进程便进行revfrom
系统调用,将数据从内核复制到进程为阻塞,结束时返回。
第一阶段非阻塞,第二阶段同步。
1.5 异步I/O
aio_read
调用内核会立即返回,进程继续执行,不会被阻塞,而当数据准备好并也已经复制完毕时会向进程发送信号,整个过程非阻塞,异步。
第一阶段非阻塞,第二阶段异步。
1.6 总结
2. I/O复用模型
2.1 select、poll
2.1.1 select执行过程
select方法
会阻塞进程,并将其注册的全部描述符从进程拷贝到内核中去,在注册的描述符中如果有事件触发则返回,返回中没有声明哪些描述符准备好了,返回值大于1时进程将轮询这些描述符找出I/O事件触发的描述符并对其进行处理。
2.1.2 poll执行过程
和select完全一致
2.1.3 select和poll的区别
select的描述符是用
数组
实现的,大小默认为1024,即能监听1024个描述符,如果要监听更多的话就需要修改数组大小并重新编译;epoll用链表
实现,大小没有限制。select的阻塞超时是ns单位,支持实时;poll则是ms
select支持的事件类型没有poll多,poll对描述符的重复利用比select高
select、poll本身是阻塞的,但是其注册描述符(套接字)不是阻塞的,如果阻塞则违背初衷,所以整个过程,还是阻塞的,只不过阻塞的对象不一样,第一阶段是select,第二阶段是recvfrom
2.2 epoll
2.2.1 执行过程
epoll_ctl()
用于向内核注册新的描述符或者是改变某个文件描述符的状态,已注册的描述符在内核中会被维护在一棵红黑树
上,通过回调函数
内核会将 I/O 准备好的描述符加入到一个链表中管理,进程调用epoll_wait()
便可以得到事件完成的描述符。
2.2.2工作模式
LT 模式
当 epoll_wait() 检测到描述符事件到达时,将此事件通知进程,进程可以不立即处理该事件,下次调用 epoll_wait() 会再次通知进程。是默认的一种模式,并且同时支持 Blocking 和 No-Blocking。
ET 模式
和 LT 模式不同的是,通知之后进程必须立即处理事件,下次再调用 epoll_wait() 时不会再得到事件到达的通知。很大程度上减少了 epoll 事件被重复触发的次数,因此效率要比 LT 模式高。只支持 No-Blocking,以避免由于一个文件句柄的阻塞读/阻塞写操作把处理多个文件描述符的任务饿死。
2.2.3 select、poll和epoll的区别
从执行过程的描述可以看出,epoll 只需要将描述符从进程缓冲区向内核缓冲区拷贝一次;并且进程不需要通过轮询来获得事件完成的描述符。
2.3 应用场景
2.3.1 select 应用场景
select 的 timeout 参数精度为 1ns,而 poll 和 epoll 为 1ms,因此 select 更加适用于实时性要求比较高的场景,比如核反应堆的控制。
2.3.2 poll 应用场景
poll 没有最大描述符数量的限制,如果平台支持并且对实时性要求不高,应该使用 poll 而不是 select。
2.3.3 epoll 应用场景
需要监控的描述符状态变化多,而且都是非常短暂的,也没有必要使用 epoll。因为 epoll 中的所有描述符都存储在内核中,造成每次需要对描述符的状态改变都需要通过 epoll_ctl() 进行系统调用,频繁系统调用降低效率。并且 epoll 的描述符存储在内核,不容易调试。
需要同时监控小于 1000 个描述符,就没有必要使用 epoll,因为这个应用场景下并不能体现 epoll 的优势。
3. 参考资料:
- Stevens W R, Fenner B, Rudoff A M. UNIX network programming[M]. Addison-Wesley Professional, 2004.
- CyC的CS-Notes的Socket篇