netty的介绍和应用场景
netty是什么?
- Netty 是由 JBOSS 提供的一个 Java 开源框架,现为 Github 上的独立项目。
- Netty 是一个 异步的、 基于事件驱动的网络应用框架,用以快速开发高性能、高可靠性的网络 IO 程序。
- Netty 主要针对在 TCP 协议下,面向 Clients 端的高并发应用,或者 Peer-to-Peer 场景下的大量数据持续传输的
应用。 - Netty 本质是一个 NIO 框架,适用于服务器通讯相关的多种应用场景
异步和同步
netty的应用场景
1) 互联网行业:在分布式系统中,各个节点之间需要远程服务调用,高性能的 RPC 框架必不可少,Netty 作为
异步高性能的通信框架,往往作为基础通信组件被这些 RPC 框架使用。
2) 典型的应用有:阿里分布式服务框架 Dubbo 的 RPC 框架使用 Dubbo 协议进行节点间通信,Dubbo 协议默
认使用 Netty 作为基础通信组件,用于实现各进程节点之间的内部通信
3) 无论是手游服务端还是大型的网络游戏,Java 语言得到了越来越广泛的应用
4) Netty 作为高性能的基础通信组件,提供了 TCP/UDP 和 HTTP 协议栈,方便定制和开发私有协议栈,账号登
录服务器
5) 地图服务器之间可以方便的通过 Netty 进行高性能的通信
6) 经典的 Hadoop 的高性能通信和序列化组件 Avro 的 RPC 框架,默认采用 Netty 进行跨界点通信
7) 它的 Netty Service 基于 Netty 框架二次封装实现。
IO模型
1) I/O 模型简单的理解:就是用什么样的通道进行数据的发送和接收,很大程度上决定了程序通信的性能
2) Java 共支持 3 种网络编程模型/IO 模式:BIO、NIO、AIO
Java BIO : 同步并阻塞(传统阻塞型),服务器实现模式为一个连接一个线程,即客户端有连接请求时服务器
端就需要启动一个线程进行处理,如果这个连接不做任何事情会造成不必要的线程开销
Java NIO : 同步非阻塞,服务器实现模式为一个线程处理多个请求(连接),即客户端发送的连接请求都会注
册到多路复用器上,多路复用器轮询到连接有 I/O 请求就进行处理
ava AIO(NIO.2) : 异步非阻塞,AIO 引入异步通道的概念,采用了 Proactor 模式,简化了程序编写,有效
的请求才启动线程,它的特点是先由操作系统完成后才通知服务端程序启动线程去处理,一般适用于连接数较
多且连接时间较长的应用
BIO、NIO、AIO 适用场景分析
1) BIO 方式适用于连接数目比较小且固定的架构,这种方式对服务器资源要求比较高,并发局限于应用中,JDK1.4
以前的唯一选择,但程序简单易理解。
2) NIO 方式适用于连接数目多且连接比较短(轻操作)的架构,比如聊天服务器,弹幕系统,服务器间通讯等。
编程比较复杂,JDK1.4 开始支持。
3)AIO 方式使用于连接数目多且连接比较长(重操作)的架构,比如相册服务器,充分调用 OS 参与并发操作,
编程比较复杂,JDK7 开始支持。
BIO
1) Java BIO 就是传统的 java io 编程,其相关的类和接口在 java.io
2) BIO(blocking I/O) : 同步阻塞,服务器实现模式为一个连接一个线程,即客户端有连接请求时服务器端就需
要启动一个线程进行处理,如果这个连接不做任何事情会造成不必要的线程开销,可以通过线程池机制改善(实
现多个客户连接服务器)。 【后有应用实例】
3) BIO 方式适用于连接数目比较小且固定的架构,这种方式对服务器资源要求比较高,并发局限于应用中,JDK1.4以前的唯一选择,程序简单易理解
对 对 BIO 编程流程的梳理
1) 服务器端启动一个 ServerSocket
2) 客户端启动 Socket 对服务器进行通信,默认情况下服务器端需要对每个客户 建立一个线程与之通讯
) 客户端发出请求后, 先咨询服务器是否有线程响应,如果没有则会等待,或者被拒绝
4) 如果有响应,客户端线程会等待请求结束后,在继续执行
package com.atguigu.bio; import java.io.InputStream; import java.net.ServerSocket; import java.net.Socket; import java.util.concurrent.ExecutorService; import java.util.concurrent.Executors; public class BIOServer { public static void main(String[] args) throws Exception { //线程池机制 //思路 //1. 创建一个线程池 //2. 如果有客户端连接,就创建一个线程,与之通讯(单独写一个方法) ExecutorService newCachedThreadPool = Executors.newCachedThreadPool(); //创建ServerSocket ServerSocket serverSocket = new ServerSocket(6666); System.out.println("服务器启动了"); while (true) { System.out.println("线程信息 id =" + Thread.currentThread().getId() + " 名字=" + Thread.currentThread().getName()); //监听,等待客户端连接 System.out.println("等待连接...."); final Socket socket = serverSocket.accept(); System.out.println("连接到一个客户端"); //就创建一个线程,与之通讯(单独写一个方法) newCachedThreadPool.execute(new Runnable() { public void run() { //我们重写 //可以和客户端通讯 handler(socket); } }); } } //编写一个handler方法,和客户端通讯 public static void handler(Socket socket) { try { System.out.println("线程信息 id =" + Thread.currentThread().getId() + " 名字=" + Thread.currentThread().getName()); byte[] bytes = new byte[1024]; //通过socket 获取输入流 InputStream inputStream = socket.getInputStream(); //循环的读取客户端发送的数据 while (true) { System.out.println("线程信息 id =" + Thread.currentThread().getId() + " 名字=" + Thread.currentThread().getName()); System.out.println("read...."); int read = inputStream.read(bytes); if(read != -1) { System.out.println(new String(bytes, 0, read )); //输出客户端发送的数据 } else { break; } } }catch (Exception e) { e.printStackTrace(); }finally { System.out.println("关闭和client的连接"); try { socket.close(); }catch (Exception e) { e.printStackTrace(); } } } }
bio存在的问题
1) 每个请求都需要创建独立的线程,与对应的客户端进行数据 Read,业务处理,数据 Write 。
2) 当并发数较大时,需要创建大量线程来处理连接,系统资源占用较大。
3) 连接建立后,如果当前线程暂时没有数据可读,则线程就阻塞在 Read 操作上,造成线程资源浪费
NIO
1) Java NIO 全称 java non-blocking IO,是指 JDK 提供的新 API。从 JDK1.4 开始,Java 提供了一系列改进的
输入/输出的新特性,被统称为 NIO(即 New IO),是同步非阻塞的
2) NIO 相关类都被放在 java.nio 包及子包下,并且对原 java.io 包中的很多类进行改写。【基本案例】
3) NIO 有三大核心部分:Channel( 通道) ,Buffer( 缓冲区), Selector( 选择器)
4) NIO 是 是 区 面向缓冲区 ,向 或者面向 块 块 编程的。数据读取到一个它稍后处理的缓冲区,需要时可在缓冲区中前后
移动,这就增加了处理过程中的灵活性,使用它可以提供非阻塞式的高伸缩性网络
5) Java NIO 的非阻塞模式,使一个线程从某通道发送请求或者读取数据,但是它仅能得到目前可用的数据,如果
目前没有数据可用时,就什么都不会获取,而不是保持线程阻塞,所以直至数据变的可以读取之前,该线程可
以继续做其他的事情。 非阻塞写也是如此,一个线程请求写入一些数据到某通道,但不需要等待它完全写入,
这个线程同时可以去做别的事情。
package com.atguigu.nio; import java.nio.IntBuffer; public class BasicBuffer { public static void main(String[] args) { //举例说明Buffer 的使用 (简单说明) //创建一个Buffer, 大小为 5, 即可以存放5个int IntBuffer intBuffer = IntBuffer.allocate(5); //向buffer 存放数据 // intBuffer.put(10); // intBuffer.put(11); // intBuffer.put(12); // intBuffer.put(13); // intBuffer.put(14); for(int i = 0; i < intBuffer.capacity(); i++) { intBuffer.put( i * 2); } //如何从buffer读取数据 //将buffer转换,读写切换(!!!) /* public final Buffer flip() { limit = position; //读数据不能超过5 position = 0; mark = -1; return this; } */ intBuffer.flip(); intBuffer.position(1);//1,2 System.out.println(intBuffer.get()); intBuffer.limit(3); while (intBuffer.hasRemaining()) { System.out.println(intBuffer.get()); } } }
NIO 和 BIO 的比较
1) BIO 以流的方式处理数据,而 NIO 以块的方式处理数据,块 I/O 的效率比流 I/O 高很多
2) BIO 是阻塞的,NIO 则是非阻塞的
3) BIO 基于字节流和字符流进行操作,而 NIO 基于 Channel(通道)和 Buffer(缓冲区)进行操作,数据总是从通道
读取到缓冲区中,或者从缓冲区写入到通道中。Selector(选择器)用于监听多个通道的事件(比如:连接请求,
数据到达等),因此使用单个线程就可以监听多个客户端通道
NIO 三大核心原理示意图
1) 每个 channel 都会对应一个 Buffer
2) Selector 对应一个线程, 一个线程对应多个 channel(连接)
3) 该图反应了有三个 channel 注册到 该 selector //程序
4) 程序切换到哪个 channel 是有事件决定的, Event 就是一个重要的概念
5) Selector 会根据不同的事件,在各个通道上切换
6) Buffer 就是一个内存块 , 底层是有一个数组
7) 数据的读取写入是通过 Buffer, 这个和 BIO , BIO 中要么是输入流,或者是
输出流, 不能双向,但是 NIO 的 Buffer 是可以读也可以写, 需要 flip 方法切换
channel 是双向的, 可以返回底层操作系统的情况, 比如 Linux , 底层的操作系统
通道就是双向的.
Buffer
缓冲区(Buffer):缓冲区本质上是一个 可以读写数据的内存块,可以理解成是一个 容器对象( 含数组),该对
象提供了一组方法,可以更轻松地使用内存块,,缓冲区对象内置了一些机制,能够跟踪和记录缓冲区的状态变化情况。Channel 提供从文件、网络读取数据的渠道,但是读取或写入的数据都必须经由 Buffer,如图: 【后面举例说明】
position 代表我要读哪个,他一定是小于limit limit代表他可读可写的范围,读写切换的时候position和 limit都会变化,如果单纯进行读或者写只有position进行变换。capacity代表最大容量,不会改变。
从前面可以看出对于 Java 中的基本数据类型(boolean 除外),都有一个 Buffer 类型与之相对应,最常用的自
然是 ByteBuffer 类(二进制数据),该类的主要方法如下:
Channel
1) NIO 的通道类似于流,但有些区别如下:
通道可以同时进行读写,而流只能读或者只能写
通道可以实现异步读写数据
通道可以从缓冲读数据,也可以写数据到缓冲:
2) BIO 中的 stream 是单向的,例如 FileInputStream 对象只能进行读取数据的操作,而 NIO 中的通道(Channel)
是双向的,可以读操作,也可以写操作。
3) Channel 在 NIO 中是一个接口
public interface Channel extends Closeable{}
4) 常 用 的 Channel 类 有 : FileChannel 、 DatagramChannel 、 ServerSocketChannel 和 SocketChannel 。
【ServerSocketChanne 类似 ServerSocket , SocketChannel 类似 Socket】
5) FileChannel 用于文件的数据读写,DatagramChannel 用于 UDP 的数据读写,ServerSocketChannel 和
SocketChannel 用于 TCP 的数据读写
filechannel
FileChannel 主要用来对本地文件进行 IO 操作,常见的方法有
public int read(ByteBuffer dst) ,从通道读取数据并放到缓冲区中
public int write(ByteBuffer src) ,把缓冲区的数据写到通道中
public long transferFrom(ReadableByteChannel src, long position, long count),从目标通道中复制数据到当前通道
public long transferTo(long position, long count, WritableByteChannel target),把数据从当前通道复制给目标通道
1)ByteBuffer 支持类型化的 put 和 get, put 放入的是什么数据类型,get 就应该使用相应的数据类型来取出,否则可能有 BufferUnderflowException 异常。
2) 可以将一个普通 Buffer 转成只读 Buffer
3) NIO 还提供了 MappedByteBuffer, 可以让文件直接在内存(堆外的内存)中进行修改, 而如何同步到文件
由 NIO 来完成.
4) 前面我们讲的读写操作,都是通过一个 Buffer 完成的,NIO 还支持 通过多个 Buffer (即 Buffer 数组) 完成读写操作,即 Scattering 和 Gathering
Selector
1) Java 的 NIO,用非阻塞的 IO 方式。可以用一个线程,处理多个的客户端连接,就会使用到 Selector(选择器)
2) Selector 能够检测多个注册的通道上是否有事件发生(注意:多个 Channel 以事件的方式可以注册到同一个
Selector),如果有事件发生,便获取事件然后针对每个事件进行相应的处理。这样就可以只用一个单线程去管
理多个通道,也就是管理多个连接和请求。
3) 只有在 连接/通道 真正有读写事件发生时,才会进行读写,就大大地减少了系统开销,并且不必为每个连接都创建一个线程,不用去维护多个线程
4) 避免了多线程之间的上下文切换导致的开销
1) Netty 的 IO 线程 NioEventLoop 聚合了 Selector(选择器,也叫多路复用器),可以同时并发处理成百上千个客
户端连接。
2) 当线程从某客户端 Socket 通道进行读写数据时,若没有数据可用时,该线程可以进行其他任务。
3) 线程通常将非阻塞 IO 的空闲时间用于在其他通道上执行 IO 操作,所以单独的线程可以管理多个输入和输出
通道。
4) 由于读写操作都是非阻塞的,这就可以充分提升 IO 线程的运行效率,避免由于频繁 I/O 阻塞导致的线程挂
起。
5) 一个 I/O 线程可以并发处理 N 个客户端连接和读写操作,这从根本上解决了传统同步阻塞 I/O 一连接一线
程模型,架构的性能、弹性伸缩能力和可靠性都得到了极大的提升。
1) NIO 中的 ServerSocketChannel 功能类似 ServerSocket,SocketChannel 功能类似 Socket
2) selector 相关方法说明
selector.select()//阻塞
selector.select(1000);//阻塞 1000 毫秒,在 1000 毫秒后返回
selector.wakeup();//唤醒 selector
selector.selectNow();//不阻塞,立马返还
对上图的说明:
1) 当客户端连接时,会通过 ServerSocketChannel 得到 SocketChannel
2) Selector 进行监听 select 方法, 返回有事件发生的通道的个数.
3) 将 socketChannel 注册到 Selector 上, register(Selector sel, int ops), 一个 selector 上可以注册多个 SocketChannel
4) 注册后返回一个 SelectionKey, 会和该 Selector 关联(集合)
5) 进一步得到各个 SelectionKey (有事件发生)
6) 在通过 SelectionKey 反向获取 SocketChannel , 方法 channel()
7) 可以通过 得到的 channel , 完成业务处理
零拷贝
1) 零拷贝是网络编程的关键,很多性能优化都离不开。
2) 在 Java 程序中,常用的零拷贝有 mmap(内存映射) 和 sendFile。那么,他们在 OS 里,到底是怎么样的一个
的设计?我们分析 mmap 和 sendFile 这两个零拷贝
3) 另外我们看下 NIO 中如何使用零拷贝
传统 IO 模型
DMA: direct memory access 直接内存拷贝(不使用 CPU)
mmap 优化
1) mmap 通过内存映射,将 文件映射到内核缓冲区,同时, 用户空间可以共享内核空间的数据。这样,在进行网
络传输时,就可以减少内核空间到用户空间的拷贝次数
sendFile 优化
数据根本不经过用户态,直接从内核缓冲区进入到Socket Buffer,同时,由于和用户态完全无关,就减少了一次上下文切换,
提示:零拷贝从操作系统角度,是没有 cpu 拷贝
Linux 在 2.4 版本中,做了一些修改,避免了从 内核缓冲区拷贝到 Socket buffer 的操作,直接拷贝到协议栈,
从而再一次减少了数据拷贝
这里其实有 一次 cpu 拷贝
kernel buffer -> socket buffer
但是,拷贝的信息很少,比如 lenght , offset , 消耗低,可以忽略
零拷贝的再次理解
1) 我们说零拷贝,是从 操作系统的角度来说的。因为内核缓冲区之间,没有数据是重复的(只有 kernel buffer 有
一份数据)。
2) 零拷贝不仅仅带来更少的数据复制,还能带来其他的性能优势,例如更少的上下文切换,更少的 CPU 缓存伪
共享以及无 CPU 校验和计算。
mmap 和 sendFile 的区别
1) mmap 适合小数据量读写,sendFile 适合大文件传输。
2) mmap 需要 4 次上下文切换,3 次数据拷贝;sendFile 需要 3 次上下文切换,最少 2 次数据拷贝。
3) sendFile 可以利用 DMA 方式,减少 CPU 拷贝,mmap 则不能(必须从内核拷贝到 Socket 缓冲区)。
//transferTo 底层使用到零拷贝