时间复杂度算法相关


算法优劣分析之
时间复杂度


时间复杂度和空间复杂度

通常,对于一个给定的算法,我们要做 两项分析。第一是从数学上证明算法的正确性,这一步主要用到形式化证明的方法及相关推理模式,如使用循环不变式、数学归纳法等。而在证明算法是正确的基础上,第二步就是分析算法的时间复杂度。算法的时间复杂度反映了程序执行时间随输入规模增长而增长的量级,在很大程度上能很好反映出算法的优劣与否。

l  算法执行时间需通过依据该算法编制的程序在计算机上运行时所消耗的时间来度量。而度量一个程序的执行时间通常有两种方法。


l 一、事后统计的方法(一般不使用)

l   这种方法可行,能够直观的反映出算法运行所耗费的时间,但不是一个好的方法。因为该方法有两个缺陷:

l 一是要想对设计的算法的运行性能进行评测,必须先依据算法编制相应的程序并实际运行。

l 二是所得时间的统计量依赖于计算机的硬件、软件等环境因素,有时容易掩盖算法本身的优势。


l 二、事前分析估算的方法

l         因事后统计方法更多的依赖于计算机的硬件、软件等环境因素,有时容易掩盖算法本身的优劣。因此人们常常采用事前分析估算的方法。

l 在编写程序前,依据统计方法对算法进行估算。一个用高级语言编写的程序在计算机上运行时所消耗的时间取决于下列因素:

l (1). 算法采用的策略、方法;

l (2). 编译产生的代码质量(这个涉及到高级语言转化成低级语言的效率,如java->c->汇编);

l (3). 问题的输入规模(如遇到大型数据计算);

l (4).  机器执行指令的速度。

l      一个算法是由控制结构(顺序、分支和循环3种)和原操作(指固有数据类型的操作,如:1+2 = ?)构成的,则算法时间取决于两者的综合效果。为了便于比较同一个问题的不同算法,通常的做法是,从算法中选取一种对于所研究的问题(或算法类型)来说是基本操作的原操作,以该基本操作的重复执行的次数作为算法的时间量度。


l 1、时间复杂度

1)时间频度

一个算法执行所耗费的时间,从理论上是不能算出来的,必须上机运行测试才能知道。但我们不可能也没有必要对每个算法都上机测试,只需知道哪个算法花费的时间多,哪个算法花费的时间少就可以了。并且一个算法花费的时间与算法中语句的执行次数成正比例,哪个算法中语句执行次数多,它花费时间就多。一个算法中的语句执行次数称为语句频度或时间频度。记为T(n)。

2)时间复杂度

在刚才提到的时间频度中,n称为问题的规模,当n不断变化时,时间频度T(n)也会不断变化。但有时我们想知道它变化时呈现什么规律。为此,我们引入时间复杂度概念。 一般情况下,算法中基本操作重复执行的次数是问题规模n的某个函数,用T(n)表示,若有某个辅助函数f(n),使得当n趋近于无穷大时,T(n)/f(n)的极限值为不等于零的常数,则称f(n)是T(n)的同数量级函数。记作T(n)=O(f(n)),称O(f(n)) 为算法的渐进时间复杂度,简称时间复杂度。


l  备注:T(n)=O(f(n)) 类似我们高中学习的多元多次函数,  辅助函数O(f(n)) 是用来描述T(n)的。

但在这里,一般都是指高阶函数;

l T (n) = Ο(f (n)) 表示存在一个常数C,使得在当n趋于正无穷时总有 T (n) ≤ C * f(n)。

此处对应上文:由于 T(n)/f(n)的极限值为不等于零的常数,则称f(n)是T(n)的同数量级函数。所以T (n)总是 ≤ C * f(n)

简单来说,就是T(n)在n趋于正无穷时最大也就跟f(n)差不多大。也就是说当n趋于正无穷时T (n)的上界是C * f(n)。其虽然对f(n)没有规定,但是一般都是取尽可能简单的函数。例如,O(2n2+n +1) = O (3n2+n+3) = O (7n2 + n) = O ( n2 ) ,一般都只用O(n2)表示就可以了。注意到大O符号里隐藏着一个常数C,所以f(n)里一般不加系数。如果把T(n)当做一棵树,那么O(f(n))所表达的就是树干,只关心其中的主干,其他的细枝末节全都抛弃不管。

l 也就是说对于指数级的运算,常数级简直可以忽略不计。

l      n2 表示n的平方


按数量级递增排列,常见的时间复杂度有:

常数阶O(1),

对数阶O(log2n),

线性阶O(n),

线性对数阶O(nlog2n),

平方阶O(n2),

立方阶O(n3),

 k次方阶O(nk),

指数阶O(2n)。

随着问题规模n的不断增大,上述时间复杂度不断增大,算法的执行效率越低。


按如下图所示:

从图中可见,我们应该尽可能选用多项式阶O(nk)的算法,而不希望用指数阶的算法。

      常见的算法时间复杂度由小到大依次为:Ο(1)<Ο(log2n)<Ο(n)<Ο(nlog2n)<Ο(n2)<Ο(n3)<…<Ο(2n)<Ο(n!)

       一般情况下,对一个问题(或一类算法)只需选择一种基本操作来讨论算法的时间复杂度即可,有时也需要同时考虑几种基本操作,甚至可以对不同的操作赋予不同的权值,以反映执行不同操作所需的相对时间,这种做法便于综合比较解决同一问题的两种完全不同的算法


3)求解算法的时间复杂度的具体步骤是:

l ⑴ 找出算法中的基本语句;

l   算法中执行次数最多的那条语句就是基本语句,通常是最内层循环的循环体。

l ⑵ 计算基本语句的执行次数的数量级;

l   只需计算基本语句执行次数的数量级,这就意味着只要保证基本语句执行次数的函数中的最高次幂正确即可,可以忽略所有低次幂和最高次幂的系数。这样能够简化算法分析,并且使注意力集中在最重要的一点上:增长率(或者说是幂次级)。

l ⑶ 用大Ο记号表示算法的时间性能。

  将基本语句执行次数的数量级放入大Ο记号中。

  如果算法中包含嵌套的循环,则基本语句通常是最内层的循环体,如果算法中包含并列的循环,则将并列循环的时间复杂度相加。(比如存在两个外循环时,两个外循环的时间复杂度都是O(n))


例如:

l for (i=1; i<=n; i++)  

l        x++;  

l for (i=1; i<=n; i++)  

l     for (j=1; j<=n; j++)  

l           x++;  

第一个for循环的时间复杂度为Ο(n),第二个for循环的时间复杂度为Ο(n2),则整个算法的时间复杂度为Ο(n+n2)=Ο(n2)。

我们一般自己写的简单算法都是肉眼可识别的。


4)在计算算法时间复杂度时有以下几个简单的程序分析法则:

l (1).对于一些简单的输入输出语句或赋值语句,近似认为需要O(1)时间

l (2).对于顺序结构,需要依次执行一系列语句所用的时间可采用大O下"求和法则"

求和法则:是指若算法的2个部分时间复杂度分别为 T1(n)=O(f(n))和 T2(n)=O(g(n)),则 T1(n)+T2(n)=O(max(f(n), g(n)))

特别地,若T1(m)=O(f(m)), T2(n)=O(g(n)),则 T1(m)+T2(n)=O(f(m) + g(n))

l (3).对于选择结构,如if语句,它的主要时间耗费是在执行then字句或else字句所用的时间,需注意的是检验条件也需要O(1)时间

l (4).对于循环结构,循环语句的运行时间主要体现在多次迭代中执行循环体以及检验循环条件的时间耗费,一般可用大O下"乘法法则"

乘法法则: 是指若算法的2个部分时间复杂度分别为 T1(n)=O(f(n))和 T2(n)=O(g(n)),则 T1*T2=O(f(n)*g(n))

l (5).对于复杂的算法,可以将它分成几个容易估算的部分,然后利用求和法则和乘法法则技术整个算法的时间复杂度


5)常见的时间复杂度求解示例说明:

(1)、O(1)

        Temp=i; i=j; j=temp;                    

以上三条单个语句的频度均为1,该程序段的执行时间是一个与问题规模n无关的常数。算法的时间复杂度为常数阶,记作T(n)=O(1)。注意:如果算法的执行时间不随着问题规模n的增加而增长,即使算法中有上千条语句,其执行时间也不过是一个较大的常数。

此类算法的时间复杂度是O(1)。

(2)、O(n2)

2.1. 交换i和j的内容

sum=0;                 (一次)  

for(i=1;i<=n;i++)     (n次)  

   for(j=1;j<=n;j++) (n2次)  

    sum++;            (n2次)

解:因为Θ(2n2+n+1)=n2(Θ即:去低阶项,去掉常数项,去掉高阶项的常参得到),所以T(n)= =O(n2);


(3)、O(n)
  a=0;  
  b=1;                      ①  
  for (i=1;i<=n;i++) ②  
  {    
     s=a+b;    ③  
     b=a;     ④    
     a=s;     ⑤  
  }  


解: 语句1的频度:2,        
           语句2的频度: n,        
          语句3的频度: n-1,        
          语句4的频度:n-1,    
          语句5的频度:n-1,                                  
          T(n)=2+n+3(n-1)=4n-1=O(n).

(4)、O(log2n)

i=1;     ①  

while (i<=n)  

  i=i*2; ②  

解: 语句1的频度是1,  

          设语句2的频度是f(n),   则:2^f(n)<=n;f(n)<=log2n    

          取最大值f(n)=log2n,

          T(n)=O(log2n )

(5)、O(n3)

for(i=0;i<n;i++)  

   {     for(j=0;j<i;j++)    

      {    for(k=0;k<j;k++)  

  x=x+2;    

      }  

   }  

解:当i=m, j=k的时候,内层循环的次数为k当i=m时, j 可以取 0,1,...,m-1 , 所以这里最内循环共进行了0+1+...+m-1=(m-1)m/2次所以,i从0取到n, 则循环共进行了: 0+(1-1)*1/2+...+(n-1)n/2=n(n+1)(n-1)/6所以时间复杂度为O(n3).


5)常用的算法的时间复杂度和空间复杂度

一个经验规则:其中c是一个常量,如果一个算法的复杂度为c log2n n n*log2n ,那么这个算法时间效率比较高 ,如果是2n ,3n ,n!,那么稍微大一些的n就会令这个算法不能动了,居于中间的几个则差强人意。


l 2、算法的空间复杂度

l         类似于时间复杂度的讨论,一个算法的空间复杂度(Space Complexity)S(n)定义为该算法所耗费的存储空间,它也是问题规模n的函数。渐近空间复杂度也常常简称为空间复杂度。

空间复杂度(Space Complexity)是对一个算法在运行过程中临时占用存储空间大小的量度。一个算法在计算机存储器上所占用的存储空间,包括存储算法本身所占用的存储空间,算法的输入输出数据所占用的存储空间和算法在运行过程中临时占用的存储空间这三个方面。算法的输入输出数据所占用的存储空间是主要解决的问题决定的,是通过参数表由调用函数传递而来的,它不随本算法的不同而改变。存储算法本身所占用的存储空间与算法书写的长短成正比,要压缩这方面的存储空间,就必须编写出较短的算法。算法在运行过程中临时占用的存储空间随算法的不同而异,有的算法只需要占用少量的临时工作单元,而且不随问题规模的大小而改变,我们称这种算法是“就地\"进行的,是节省存储的算法,上文介绍过的几个算法都是如此;有的算法需要占用的临时工作单元数与解决问题的规模n有关,它随着n的增大而增大,当n较大时,将占用较多的存储单元,例如将上文介绍的快速排序和归并排序算法就属于这种情况。

由于硬件设备发展迅速,所以算法的效率高低,主要是看时间复杂度,空间复杂度一    般则不考虑。

猜你喜欢

转载自blog.csdn.net/qq564045867/article/details/62882797