在很多时候, 由于原始数据的不确定性, 算法的复杂度并不是唯一的, 可能具有多种不同的复杂度, 一个算法完整的时间复杂度分析包括如下:
-
最好情况时间复杂度(best case time complexity);
-
最坏情况时间复杂度(worst case time complexity);
-
平均情况时间复杂度(average case time complexity);
-
均摊时间复杂度(amortized time complexity);
show a code
// 在一个无序的数组(array)中,查找变量 x 出现的位置。如果没有找到,就返回 -1。
// n表示数组array的长度
int find(int[] array, int n, int x) {
int i = 0;
int pos = -1;
for (; i < n; ++i) {
if (array[i] == x) {
pos = i;
break;
}
}
return pos;
}
最好情况时间复杂度
数组中第一个元素正好是要查找的变量 x,那就不需要继续遍历剩下的 n-1 个数据了,那时间复杂度就是 O(1).
最坏情况时间复杂度
若数组中不存在变量 x,那我们就需要把整个数组都遍历一遍,时间复杂度就成了 O(n)。
平均情况时间复杂度
最好情况时间复杂度和最坏情况时间复杂度对应的都是极端情况下的代码复杂度,发生的概率其实并不大。为了更好地表示平均情况下的复杂度,我们需要引入另一个概念:平均情况时间复杂度,后面我简称为
平均时间复杂度
.
- 简要分析(不考虑概率问题)
有 n+1 种情况:在数组的 0~n-1 位置中和不在数组中。我们把每种情况下,查找需要遍历的元素个数累加起来,然后再除以 n+1,就可以得到需要遍历的元素个数的平均值,即:
省略掉系数、低阶、常量,所以,咱们把刚刚这个公式简化之后,得到的平均时间复杂度就是 O(n).
- 更合理详细的分析
- 假设在数组中与不在数组中的概率都为 1/2;
- 且数据出现在 0~n-1 这 n 个位置的概率也是一样的, 为 1/n;
这个值就是概率论中的加权平均值
,也叫作期望值
,所以平均时间复杂度的全称应该叫加权平均时间复杂度
或者期望时间复杂度
。用大 O 表示法来表示,去掉系数和常量,这段代码的加权平均时间复杂度仍然是 O(n)。