算法效率与复杂度

1，what is 算法

算法的五大特性

输入: 算法具有0个或多个输入
输出: 算法至少有1个或多个输出
有穷性: 算法在有限的步骤之后会自动结束而不会无限循环，并且每一个步骤可以在可接受的时间内完成
确定性：算法中的每一步都有确定的含义，不会出现二义性
可行性：算法的每一步都是可行的，也就是说每一步都能够执行有限的次数完成

我举个栗子：如果 a+b+c=100，且 a^2+b^2=c^2（a,b,c 为自然数），如何求出所有a、b、c可能的组合?

In [3]: import time
   ...:
   ...: start_time = time.time()
   ...:
   ...: # 注意是三重循环
   ...: for a in range(0, 101):
   ...:     for b in range(0, 101):
   ...:         for c in range(0, 101):
   ...:             if a**2 + b**2 == c**2 and a+b+c == 100:
   ...:                 print("a, b, c: %d, %d, %d" % (a, b, c))
   ...:
   ...: end_time = time.time()
   ...: print("elapsed: %f" % (end_time - start_time))
   ...: print("complete!")
   ...:

运行结果：

a, b, c: 0, 50, 50
a, b, c: 50, 0, 50
elapsed: 1.564089
complete!

In [4]:

我本来还想求 a+b+c=1000 的，可以我电脑死机了。没办法，电脑CPU太差了，运行不了。所以就选了100.（偷偷告诉你，500我电脑都不行）。
注意运行时间哈
现在换个算法：


In [4]: import time
   ...:
   ...: start_time = time.time()
   ...:
   ...: # 注意是两重循环
   ...: for a in range(0, 101):
   ...:     for b in range(0, 101-a):
   ...:         c = 100 - a - b
   ...:         if a**2 + b**2 == c**2:
   ...:             print("a, b, c: %d, %d, %d" % (a, b, c))
   ...:
   ...: end_time = time.time()
   ...: print("elapsed: %f" % (end_time - start_time))
   ...: print("complete!")
   ...:

运行结果：

a, b, c: 0, 50, 50
a, b, c: 50, 0, 50
elapsed: 0.009000
complete!

In [5]:

看到时间差了吧。这就是算法对程序运行效率的影响。一般来说，执行时间能够在一定程度上反应算法的效率，所以称之为时间复杂度。

2，时间复杂度与“大O记法”

我们假定计算机执行算法每一个基本操作的时间是固定的一个时间单位，那么有多少个基本操作就代表会花费多少时间单位。算然对于不同的机器环境而言，确切的单位时间是不同的，但是对于算法进行多少个基本操作（即花费多少时间单位）在规模数量级上却是相同的，由此可以忽略机器环境的影响而客观的反应算法的时间效率。

对于算法的时间效率，我们可以用“大O记法”来表示。
“大O记法”：对于单调的整数函数f，如果存在一个整数函数g和实常数c>0，使得对于充分大的n总有f(n)<=c*g(n)，就说函数g是f的一个渐近函数（忽略常数），记为f(n)=O(g(n))。也就是说，在趋向无穷的极限意义下，函数f的增长速度受到函数g的约束，亦即函数f与函数g的特征相似。
时间复杂度：假设存在函数g，使得算法A处理规模为n的问题示例所用时间为T(n)=O(g(n))，则称O(g(n))为算法A的渐近时间复杂度，简称时间复杂度，记为T(n)

时间复杂度有几种分类：

算法完成工作最少需要多少基本操作，即最优时间复杂度
算法完成工作最多需要多少基本操作，即最坏时间复杂度
算法完成工作平均需要多少基本操作，即平均时间复杂度

而我们平时所说的时间复杂度，一般都是指最坏时间复杂度，

时间复杂度的几条基本计算规则：

基本操作，即只有常数项，认为其时间复杂度为O(1)
顺序结构，时间复杂度按加法进行计算
循环结构，时间复杂度按乘法进行计算
分支结构，时间复杂度取最大值
判断一个算法的效率时，往往只需要关注操作数量的最高次项，其它次要项和常数项可以忽略
在没有特殊说明时，我们所分析的算法的时间复杂度都是指最坏时间复杂度

2，常见的时间复杂度

执行次数函数举例	阶	非正式术语
12	O(1)	常数阶
2n+3	O(n)	线性阶
3n2+2n+1	O(n^2)	平方阶
5log2n+20	O(logn)	对数阶
2n+3nlog2n+19	O(nlogn)	nlogn阶
6n3+2n2+3n+4	O(n^3)	立方阶
2n	O(2n)	指数阶

注意，经常将log2n（以2为底的对数）简写成logn

常见时间复杂度之间的关系:
这里写图片描述
所消耗的时间从小到大

O(1) < O(logn) < O(n) < O(nlogn) < O(n^2) < O(n^3) < O(2^n) < O(n!) < O(n^n)

3，数据结构

定义：数据结构是计算机存储、组织数据的方式。数据结构是指相互之间存在一种或多种特定关系的数据元素的集合。通常情况下，精心选择的数据结构可以带来更高的运行或者存储效率。数据结构往往同高效的检索算法和索引技术有关。
数据结构是指相互之间存在着一种或多种关系的数据元素的集合和该集合中数据元素之间的关系组成。记为：
Data_Structure=(D,R)
其中D是数据元素的集合，R是该集合中所有元素之间的关系的有限集合。—-来自百科

看不懂是吧，我也是。我觉得所谓的数据结构大抵就是数据的类型以及数据储存方式的一个集合。

算法与数据结构的区别：
数据结构只是静态的描述了数据元素之间的关系。

高效的程序需要在数据结构的基础上设计和选择算法。

程序 = 数据结构 + 算法

In a word：算法是为了解决实际问题而设计的，数据结构是算法需要处理的问题载体

Conclusion：

不会算法的程序猿不是好程序猿。