上下文切换或线程创建和回收的耗时问题
写了程序,分别用单线程、2线程、4线程来实现。
![图片说明](https://uploadfiles.nowcoder.com/images/20200419/8684290_1587227439944_5BD773F442EF0A3D7042E16D598A1D77 "图片标题")
我的开的虚拟机是4核。
![图片说明](https://uploadfiles.nowcoder.com/images/20200419/8684290_1587227573207_44686EDD604097AB154148B2C67AAA21 "图片标题")
需要注意的是,在无锁的情况下,一核一线程,一般不发生上下文切换,所以多线程和单线程的区别主要就是系统创建和回收线程时的耗时。
表格如下
根据多次实验结果,总结如下表,取平均值,并抛弃掉明显不合适的值(比如计算10的1次方时,竟耗费1000毫秒)
(10的n次方,耗时单位为毫秒)
n | 单线程 | 双线程无锁 | 四线程无锁 | 双线程有锁 | 四线程有锁 |
---|---|---|---|---|---|
1 | 150.2 | 178.4 | 380.4 | 226.4 | 403.2 |
2 | 180.8 | 174.8 | 371 | 223.4 | 416.2 |
3 | 181.8 | 170.2 | 382.8 | 179.6 | 393.8 |
4 | 210.8 | 304.4 | 339.4 | 278.8 | 397.4 |
5 | 709.8 | 458 | 469.4 | 488 | 523.6 |
6 | 5730 | 2763 | 2483.4 | 2827.4 | 2404.9 |
7 | 58243 | 26851.2 | 16617.2 | 32060.8 | 21691.8 |
8 | 544211.1 | 331048.8 | 213035.8 | 348153.8 | 242503.8 |
9 | 7659838.2 | 4317656.4 | 2988326.6 | 4344095.8 | 3225421.2 |
总结:因为在无锁的情况下,一核一线程,一般不发生上下文切换,所以和单线程的区别主要就是系统创建和回收线程时的耗时。在n较小的情况下,多线程的优势无法完全体现(浪费在创建和回收线程的时间已经足够计算出结果了)。而在有锁的时会发生上下文切换,即竞争锁时的耗时,此耗时较多。但是当n变大以后,该时间可忽略。总体来看,在n为6时,多线程的优势开始体现。此时双线程的执行速度也开始比四线程慢。纵向来看,n大于4时,所有线程执行时间都是随着n的增大而增大,即此时n已经足够大了,“上下文切换”或者“线程创建和回收”的耗时已经远小于计算pi所需要的时间,即此类耗时在n大于4时可以忽略。此外,不论n大小为几,几乎所有无锁双线程比有锁双线程快、无锁四线程比有锁四线程快。为什么是几乎呢?我认为,即使是同一个cpu,在不同时间内性能可能有略微不同,即CPU不可能完全100%保证每时每刻性能一定一样,而有些程序执行时间本来就接近,所以导致有例外(比如当n=6时,四线程有锁比四线程无锁还快)。我如果要计算“互斥方式的运行时间”如何计算呢?我认为,当n很大时,随着n的增加,计算所需要的时间也越来越大,CPU因为略微不稳定导致的误差也会随着时间的变大而变大。根据我刚才的结论,n小于等于4时,比较适合计算“互斥方式的运行时间”,此时CPU导致的误差比较小,计算结果应该也比较合理。根据我计算所得,双线程“互斥方式的运行时间”为80.8微妙,四线程“互斥方式的运行时间”为137微妙。也就是说,假设某个程序中有一个锁,在线程数不小于1不大于4的条件下,平均每增加一个线程,就会因“锁变量互斥”而额外消耗40.4到68.5微秒。