Python进阶之CPU计算密集型和IO密集型

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/m0_37338590/article/details/83897869

在最近往服务器部署爬虫程序的时候,遇到了一个很奇怪的问题,就是部署上之后运行一段时间或者是直接不运行就进入休眠状态了,开始一直怀疑是由于服务器内存不足导致的程序休眠,后来废了好大的劲,最终找到了罪魁祸首,具体分析我通过这几篇连载的博客来分析一下,正好也对给自己充充电。

第一种任务的类型是计算密集型任务,其特点是要进行大量的计算,消耗CPU资源,比如计算圆周率、对视频进行高清解码等等,全靠CPU的运算能力。这种计算密集型任务虽然也可以用多任务完成,但是任务越多,花在任务切换的时间就越多,CPU执行任务的效率就越低,所以,要最高效地利用CPU,计算密集型任务同时进行的数量应当等于CPU的核心数。

计算密集型任务由于主要消耗CPU资源,因此,代码运行效率至关重要。Python这样的脚本语言运行效率很低,完全不适合计算密集型任务。对于计算密集型任务,最好用C语言编写。

第二种任务的类型是IO密集型,涉及到网络、磁盘IO的任务都是IO密集型任务,这类任务的特点是CPU消耗很少,任务的大部分时间都在等待IO操作完成(因为IO的速度远远低于CPU和内存的速度)。对于IO密集型任务,任务越多,CPU效率越高,但也有一个限度。常见的大部分任务都是IO密集型任务,比如Web应用。

IO密集型任务执行期间,99%的时间都花在IO上,花在CPU上的时间很少,因此,用运行速度极快的C语言替换用Python这样运行速度极低的脚本语言,完全无法提升运行效率。对于IO密集型任务,最合适的语言就是开发效率最高(代码量最少)的语言,脚本语言是首选,C语言最差。

关于Python对这两种任务类型的使用请参见这篇博客:python进阶之进程、线程和协程在实际应用中的问题

猜你喜欢

转载自blog.csdn.net/m0_37338590/article/details/83897869