Linux 高并发的实现, 线程池的实现思想, 怎样处理高并发

Linux 高并发的实现

内核TCP参数方面

Linux系统下，TCP连接断开后，会以TIME_WAIT状态保留一定的时间，然后才会释放端口。当并发请求过多的时候，就会产生大量的TIME_WAIT状态的连接，无法及时断开的话，会占用大量的端口资源和服务器资源。这个时候我们可以优化TCP的内核参数，来及时将TIME_WAIT状态的端口清理掉，让系统更快的释放TIME_WAIT连接。

IO事件分配机制

在Linux启用高并发TCP连接，必须确认应用程序是否使用了合适的网络I/O技术和I/O事件分派机制。可用的I/O技术有同步I/O，非阻塞式同步I/O，以及异步I/O。在高TCP并发的情形下，如果使用同步I/O，这会严重阻塞程序的运转，除非为每个TCP连接的I/O创建一个线程。但是，过多的线程又会因系统对线程的调度造成巨大开销。因此，在高TCP并发的情形下使用同步I/O是不可取的，这时可以考虑使用非阻塞式同步I/O或异步I/O。非阻塞式同步I/O的技术包括使用select()，poll()，epoll等机制。异步I/O的技术就是使用AIO。

从I/O事件分派机制来看，使用select()是不合适的，因为它所支持的并发连接数有限(通常在1024个以内)。如果考虑性能，poll()也是不合适的，尽管它可以支持的较高的TCP并发数，但是由于其采用“轮询”机制，当并发数较高时，其运行效率相当低，并可能存在I/O事件分派不均，导致部分TCP连接上的I/O出现“饥饿”现象。而如果使用epoll或AIO，则没有上述问题(早期Linux内核的AIO技术实现是通过在内核中为每个I/O请求创建一个线程来实现的，这种实现机制在高并发TCP连接的情形下使用其实也有严重的性能问题。但在最新的Linux内核中，AIO的实现已经得到改进)。

综上所述，在开发支持高并发TCP连接的Linux应用程序时，应尽量使用epoll或AIO技术来实现并发的TCP连接上的I/O控制，这将为提升程序对高并发TCP连接的支持提供有效的I/O保证。

线程池

线程池是一种线程使用模式。线程过多会带来额外的开销，其中包括创建销毁线程的开销、线程调度的开销等。消耗过度的内存资源，并且降低整体性能。线程池维护多个线程，等待管理者分配可并发执行的任务。这种做法，一方面避免了处理任务时创建和销毁线程开销的代价，另一方面避免了线程数量膨胀导致的过分调度问题，保证了对内核的充分利用。

线程池的重要参数

核心线程数：线程池中保留的线程数，即使它们是空闲的，除非设置 allowCoreThreadTimeOut。

最大线程数：线程池中允许的最大线程数

线程空闲时间：如果经过 keepAliveTime 时间后，超过核心线程数的线程还没有接受到新的任务，那就回收

单位：keepAliveTime 的时间单位

存放待执行任务的队列：当提交的任务数超过核心线程数后，再提交的任务就存放在这里。它仅仅用来存放被 execute 方法提交的 Runnable 任务。

线程工厂：执行程序创建新线程时使用的工厂。比如我们项目中自定义的线程工厂，排查问题的时候，根据线程工厂的名称就知道这个线程来自哪里，很快的定位出问题，

拒绝策略：当队列里面放满了任务、最大线程数的线程都在工作时，这时继续提交的任务线程池就处理不了，应该执行怎么样的拒绝策略。

线程池的使用场景
线程池各个参数的含义，你平时用的什么队列以及拒绝策略？
程序中哪些地方用到了线程池，用线程池的好处有哪些？
如何自己实现一个线程池
JDK 提供了哪些线程池的默认实现