递归树
递归的思想就是,将大问题分解为小问题来求解,然后再将小问题分解为小小问题。
这样一层一层地分解,直到问题的数据规模被分解得足够小,不用继续递归分解为止。
如果我们把这个一层一层的分解过程画成图,它其实就是一棵树。我们给这棵树起一个名字,叫作递归树。
递归代码的时间复杂度分析起来很麻烦,可以利用递推公式来求解算法的时间复杂度,如求解归并排序、快速排序的时间复杂度
但是些情况,比如快排的平均时间复杂度的分析,用递推公式的话,会涉及非常复杂的数学推导。
此时我们就可以借助递归树来分析递归实现算法的时间复杂度
如何用递归树求解时间复杂度
递归树分析归并排序时间复杂度
归并排序每次会将数据一分为二,因为每次分解都是一分为二,所以代价很低,我们把时间上的消耗记作常量 1。
归并算法中比较耗时的是归并操作,也就是把两个子数组合并为大数组。
每一层归并操作消耗的时间总和是一样的,跟要排序的数据规模有关。把每一层归并操作消耗的时间记作 n。
那么只需要知道这棵树的高度 h,用高度 h 乘以每一层的时间消耗 n,就可以得到总的时间复杂度 O(n∗h)。
从归并排序的原理可以看出来,归并排序的递归树是一棵满二叉树,而满二叉树的高度大约是log n 。
所以,归并排序递归实现的时间复杂度就是 O(nlogn)。
当然,除了用递归树来分析归并排序递归实现的时间复杂度,还可以利用递推公式来分析
具体方法在我的归并排序分析里面有:https://blog.csdn.net/qq_42006733/article/details/104415767
递归树分析快速排序时间复杂度
关于利用递推公式来分析递归实现算法的时间复杂度对于快速排序来说就相对于复杂。
快速排序在最好情况下,分区点选择及其合理,每次分区都能一分为二的时候。
这个时候用递推公式 T(n)=2T(n/2)+n,很容易就能推导出时间复杂度是 O(nlogn)。
但是,并不可能每次分区都这么幸运,正好一分为二。
假设平均情况下,每次分区之后,两个分区的大小比例为 1:k。
当 k=9 时,如果用递推公式的方法来求解时间复杂度的话,递推公式就写成 T(n)=T(n/10)+T(9*n/10)+n。
利用递推公式来分析时间复杂度也是可以的,但是推导过程就很复杂。
在这种情况下利用递归树就简单的很多。
仍假设k=9 的时候,快速排序的过程中,每次分区都要遍历待分区区间的所有数据 。
跟归并排序一样,每一层分区操作所遍历的数据的个数之和就是 n。
我们现在只要求出递归树的高度 h,这个快排过程遍历的数据个数就是 h∗n ,也就是说,时间复杂度就是 O(h∗n)。
但是归并排序中每次分区都是一分为二,所以归并排序的递归树是满二叉树。高度为log n
而快速排序每次分区并不是均匀地一分为二,所以递归树并不是满二叉树。高度就不是log n 了。
归并排序中,开始合并的条件是数据已经被划分为单个的了,而快速排序结束的条件就是待排序的小区间,大小为 1。
那么就是说叶子节点里的数据规模是 1。而根节点是n。
那么递归树中最短的一个路径每次都乘以 1/10,最长的一个路径每次都乘以 9/10 。
遍历数据的个数总和就介于 nlog10n 和 nlog910n 之间。
根据复杂度的大 O 表示法,对数复杂度的底数不管是多少,我们统一写成 log n
当分区大小比例是 1:9 时,快速排序的时间复杂度仍然是 O(nlogn)。
若k = 99,也就是说每次的分区更加不平均了,还是类似的方法,求的树的最短路径就是 log100 n,最长路径是 log 99/100 n
只是底数变了,但是时间复杂度也仍然是 O(nlogn)。
不管k的值是多少,甚至是 999,9999,只要 k 的值不随 n 变化,是一个事先确定的常量,那快排的时间复杂度就是 O(nlogn)。
所以说快排的平均时间复杂度就是 O(nlogn)。
递归树分析斐波那契数列时间复杂度
斐波那契数列就是经典的递推,F(1)=1,F(2)=1, F(n)=F(n - 1)+F(n - 2)(n ≥ 3,n ∈ N*)
用代码表示就是
int f(int n) {
if (n == 1) return 1;
if (n == 2) return 2;
return f(n-1) + f(n-2);
}
同样的方法,f(n) 分解为 f(n−1) 和 f(n−2),每次数据规模都是 −1 或者 −2,叶子节点的数据规模是 1 或者 2。
根节点走到叶子节点,每条路径是长短不一的。
如果每次都是 −1,那最长路径大约就是 n;如果每次都是 −2,那最短路径大约就是 n/2。
斐波那契数列分解后的合并只是一次加法运算,若把这次加法运算的时间消耗记作 1。
从上往下,第一层的总时间消耗是 1,第二层的总时间消耗是 2,第三层的总时间消耗就是 22。
依次类推,第 k 层的时间消耗就是 2^k−1
如果路径长度都为 n,那这个总和就是 2^n−1。
如果路径长度都是 2n ,那整个算法的总的时间消耗就是 2^(n/2)−1。
所以斐波那契数列算法的时间复杂度就介于 O(2^n) 和 O(2^(n/2)) 之间。
虽然这样得到的结果只是一个范围,但是已经可以明确这个算法的时间复杂度是指数级的,非常之高。