多线程执行时，上下文切换或线程创建和回收的耗时问题

上下文切换或线程创建和回收的耗时问题

写了程序，分别用单线程、2线程、4线程来实现。

![图片说明](https://uploadfiles.nowcoder.com/images/20200419/8684290_1587227439944_5BD773F442EF0A3D7042E16D598A1D77 "图片标题")
我的开的虚拟机是4核。
![图片说明](https://uploadfiles.nowcoder.com/images/20200419/8684290_1587227573207_44686EDD604097AB154148B2C67AAA21 "图片标题")
需要注意的是，在无锁的情况下，一核一线程，一般不发生上下文切换，所以多线程和单线程的区别主要就是系统创建和回收线程时的耗时。

表格如下

根据多次实验结果，总结如下表，取平均值，并抛弃掉明显不合适的值（比如计算10的1次方时，竟耗费1000毫秒）
（10的n次方，耗时单位为毫秒）

n	单线程	双线程无锁	四线程无锁	双线程有锁	四线程有锁
1	150.2	178.4	380.4	226.4	403.2
2	180.8	174.8	371	223.4	416.2
3	181.8	170.2	382.8	179.6	393.8
4	210.8	304.4	339.4	278.8	397.4
5	709.8	458	469.4	488	523.6
6	5730	2763	2483.4	2827.4	2404.9
7	58243	26851.2	16617.2	32060.8	21691.8
8	544211.1	331048.8	213035.8	348153.8	242503.8
9	7659838.2	4317656.4	2988326.6	4344095.8	3225421.2

总结：因为在无锁的情况下，一核一线程，一般不发生上下文切换，所以和单线程的区别主要就是系统创建和回收线程时的耗时。在n较小的情况下，多线程的优势无法完全体现（浪费在创建和回收线程的时间已经足够计算出结果了）。而在有锁的时会发生上下文切换，即竞争锁时的耗时，此耗时较多。但是当n变大以后，该时间可忽略。总体来看，在n为6时，多线程的优势开始体现。此时双线程的执行速度也开始比四线程慢。纵向来看，n大于4时，所有线程执行时间都是随着n的增大而增大，即此时n已经足够大了，“上下文切换”或者“线程创建和回收”的耗时已经远小于计算pi所需要的时间，即此类耗时在n大于4时可以忽略。此外，不论n大小为几，几乎所有无锁双线程比有锁双线程快、无锁四线程比有锁四线程快。为什么是几乎呢？我认为，即使是同一个cpu，在不同时间内性能可能有略微不同，即CPU不可能完全100%保证每时每刻性能一定一样，而有些程序执行时间本来就接近，所以导致有例外（比如当n=6时，四线程有锁比四线程无锁还快）。我如果要计算“互斥方式的运行时间”如何计算呢？我认为，当n很大时，随着n的增加，计算所需要的时间也越来越大，CPU因为略微不稳定导致的误差也会随着时间的变大而变大。根据我刚才的结论，n小于等于4时，比较适合计算“互斥方式的运行时间”，此时CPU导致的误差比较小，计算结果应该也比较合理。根据我计算所得，双线程“互斥方式的运行时间”为80.8微妙，四线程“互斥方式的运行时间”为137微妙。也就是说，假设某个程序中有一个锁，在线程数不小于1不大于4的条件下，平均每增加一个线程，就会因“锁变量互斥”而额外消耗40.4到68.5微秒。