目录
我们常说工作中遇不到数据结构和算法,其实是我们主动或无意识过滤掉这样的机会。
1 是什么
- 数据结构和算法解决是“如何让计算机更快时间、更省空间的解决问题”。
- 因此需从执行时间和占用空间两个维度来评估数据结构和算法的性能。
- 分别用时间复杂度和空间复杂度两个概念来描述性能问题,二者统称为复杂度。
- 复杂度描述的是算法执行时间(或占用空间)与数据规模的增长关系。
2 为什么
为什么要进行复杂度分析?
- 和性能测试相比,复杂度分析有不依赖执行环境、成本低、效率高、易操作、指导性强的特点。
- 掌握复杂度分析,将能编写出性能更优的代码,有利于降低系统开发和维护成本。
3 如何分析
3.1 大 O 复杂度表示法
3.1.1 举例
代码:
int cal(int n) {
int sum = 0;
int i = 1;
int j = 1;
for (; i <= n; ++i) {
j = 1;
for (; j <= n; ++j) {
sum = sum + i * j;
}
}
}
- 每行代码执行时间都是
unit_time
; - 第 2、3、4 行代码,每行都需要 1 个 unit_time 的执行时间;
- 第 5、6 行代码循环执行了 n 遍,需要
2n * unit_time
的执行时间; - 第 7、8 行代码循环执行了 n 遍,所以需要
2n * unit_time
的执行时间; - 所以,整段代码总的执行时间
T(n) = (2n +2n+3)*unit_time
。
因此得出,所有代码的执行时间 T(n) 与每行代码的执行次数 n 成正比。
3.1.2 大 O 公式
算法的执行时间与每行代码的执行次数成正比,用 T(n) = O(f(n))
表示。
T(n)
表示算法执行总时间;f(n)
表示每行代码执行总次数,n
往往表示数据的规模。- 公式中的
O
表示代码的执行时间T(n)
与f(n)
成正比;
3.1.3 时间复杂度
所以 3.1.1
中的例子 T(n) = O(2n +2n+3)
,就是大 O 时间复杂度表示法。
大 O 时间复杂度实际上并不具体表示代码真正的执行时间,而是表示代码执行时间随数据规模增长的变化趋势,所以,也叫作渐进时间复杂度(asymptotic time complexity),简称时间复杂度。
当 n 很大时,你可以把它想象成 10000、100000。而公式中的低阶、常量、系数三部分并不左右增长趋势,所以都可以忽略。我们只需要记录一个最大量级就可以了,如果用大 O 表示法表示刚讲的那段代码的时间复杂度,就可以记为:
;同理还有其他诸如 T(n) = O(n)
等等。
3.1.4 复杂度分析法则
-
单段代码看高频:比如循环;
-
多段代码取最大:比如一段代码中有单循环和多重循环,那么取多重循环的复杂度;
强调一段代码循环
10000
次,1000000
次,只要是一个已知的数,也还是常量级的执行时间,相对于无限大的n
,都可以忽略掉。
抽象公式:如果T1(n)=O(f(n))
,T2(n)=O(g(n))
;那么T(n)=T1(n)+T2(n)=max(O(f(n)), O(g(n))) =O(max(f(n), g(n)))
。
- 嵌套代码求乘积:比如递归、多重循环等;
如果
T1(n)=O(f(n))
,T2(n)=O(g(n))
;那么T(n)=T1(n)*T2(n)=O(f(n))*O(g(n))=O(f(n)*g(n))
。
也就是说,假设 , ,则 。
迭代代码示例如下:
整体时间复杂度就是 。
int cal(int n) {
int ret = 0;
int i = 1;
for (; i < n; ++i) {
ret = ret + f(i);
}
}
int f(int n) {
int sum = 0;
int i = 1;
for (; i < n; ++i) {
sum = sum + i;
}
return sum;
}
- 多个规模求加法:比如方法有两个参数控制两个循环的次数,那么这时就取二者复杂度相加。
3.1.5 常用的复杂度级别
3.1.5.1 多项式阶
随着数据规模的增长,算法的执行时间和空间占用,按照多项式的比例增长。
- O(1)(常数阶)
首先你必须明确一个概念,O(1) 只是常量级时间复杂度的一种表示方法,并不是指只执行了一行代码。
一般情况下,只要算法中不存在循环语句、递归语句,即使有成千上万行的代码,其时间复杂度也是Ο(1)。
- O(logn)(对数阶)
- O(n)(线性阶)
- O(nlogn)(线性对数阶)
- (平方阶)
- (立方阶)
3.1.5.2 非多项式阶
随着数据规模的增长,算法的执行时间和空间占用暴增,这类算法性能极差。
- (指数阶)
- (阶乘阶)
3.2 空间复杂度分析
前面,咱们花了很长时间讲大 O 表示法和时间复杂度分析,理解了前面讲的内容,空间复杂度分析方法学起来就非常简单了。
时间复杂度的全称是渐进时间复杂度,表示算法的执行时间与数据规模之间的增长关系。类比一下,空间复杂度全称就是渐进空间复杂度(asymptotic space complexity),表示算法的存储空间与数据规模之间的增长关系。
3.2.1 举例分析
- 代码示例:
void print(int n) {
int i = 0;
int[] a = new int[n];
for (i; i < n; ++i) {
a[i] = i * i;
}
for (i = n - 1; i >= 0; --i) {
print out a[i]
}
}
- 跟时间复杂度分析一样,我们可以看到,第 2 行代码中,我们申请了一个空间存储变量 i,但是它是常量阶的,跟数据规模
n
没有关系,所以我们可以忽略; - 第 3 行申请了一个大小为 n 的 int 类型数组,除此之外,剩下的代码都没有占用更多的空间,所以整段代码的空间复杂度就是
O(n)
。 - 我们常见的空间复杂度就是 O(1)、O(n)、 ,像 O(logn)、O(nlogn) 这样的对数阶复杂度平时都用不到;
- 而且,空间复杂度分析比时间复杂度分析要简单很多。所以,对于空间复杂度,掌握刚我说的这些内容已经足够了。
总结
复杂度也叫渐进复杂度,包括时间复杂度和空间复杂度,用来分析算法执行效率与数据规模之间的增长关系,可以粗略地表示,越高阶复杂度的算法,执行效率越低。常见的复杂度并不多,从低阶到高阶有:O(1)、O(logn)、O(n)、O(nlogn)、 。等你学完整个专栏之后,你就会发现几乎所有的数据结构和算法的复杂度都跑不出这几个。