上下文切换或线程创建和回收的耗时问题

写了程序,分别用单线程、2线程、4线程来实现。

![图片说明](https://uploadfiles.nowcoder.com/images/20200419/8684290_1587227439944_5BD773F442EF0A3D7042E16D598A1D77 "图片标题")
我的开的虚拟机是4核。
![图片说明](https://uploadfiles.nowcoder.com/images/20200419/8684290_1587227573207_44686EDD604097AB154148B2C67AAA21 "图片标题")
需要注意的是,在无锁的情况下,一核一线程,一般不发生上下文切换,所以多线程和单线程的区别主要就是系统创建和回收线程时的耗时。

表格如下

根据多次实验结果,总结如下表,取平均值,并抛弃掉明显不合适的值(比如计算10的1次方时,竟耗费1000毫秒)
(10的n次方,耗时单位为毫秒)

n 单线程 双线程无锁 四线程无锁 双线程有锁 四线程有锁
1 150.2 178.4 380.4 226.4 403.2
2 180.8 174.8 371 223.4 416.2
3 181.8 170.2 382.8 179.6 393.8
4 210.8 304.4 339.4 278.8 397.4
5 709.8 458 469.4 488 523.6
6 5730 2763 2483.4 2827.4 2404.9
7 58243 26851.2 16617.2 32060.8 21691.8
8 544211.1 331048.8 213035.8 348153.8 242503.8
9 7659838.2 4317656.4 2988326.6 4344095.8 3225421.2

总结:因为在无锁的情况下,一核一线程,一般不发生上下文切换,所以和单线程的区别主要就是系统创建和回收线程时的耗时。在n较小的情况下,多线程的优势无法完全体现(浪费在创建和回收线程的时间已经足够计算出结果了)。而在有锁的时会发生上下文切换,即竞争锁时的耗时,此耗时较多。但是当n变大以后,该时间可忽略。总体来看,在n为6时,多线程的优势开始体现。此时双线程的执行速度也开始比四线程慢。纵向来看,n大于4时,所有线程执行时间都是随着n的增大而增大,即此时n已经足够大了,“上下文切换”或者“线程创建和回收”的耗时已经远小于计算pi所需要的时间,即此类耗时在n大于4时可以忽略。此外,不论n大小为几,几乎所有无锁双线程比有锁双线程快、无锁四线程比有锁四线程快。为什么是几乎呢?我认为,即使是同一个cpu,在不同时间内性能可能有略微不同,即CPU不可能完全100%保证每时每刻性能一定一样,而有些程序执行时间本来就接近,所以导致有例外(比如当n=6时,四线程有锁比四线程无锁还快)。我如果要计算“互斥方式的运行时间”如何计算呢?我认为,当n很大时,随着n的增加,计算所需要的时间也越来越大,CPU因为略微不稳定导致的误差也会随着时间的变大而变大。根据我刚才的结论,n小于等于4时,比较适合计算“互斥方式的运行时间”,此时CPU导致的误差比较小,计算结果应该也比较合理。根据我计算所得,双线程“互斥方式的运行时间”为80.8微妙,四线程“互斥方式的运行时间”为137微妙。也就是说,假设某个程序中有一个锁,在线程数不小于1不大于4的条件下,平均每增加一个线程,就会因“锁变量互斥”而额外消耗40.4到68.5微秒。