寻找数组中第k小的数:平均情况下时间复杂度为O(n)的快速选择算法

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qibofang/article/details/51953338

又叫线性选择算法,这是一种平均情况下时间复杂度为O(n)的快速选择算法,用到的是快速排序中的第一步,将第一个数作为中枢,使大于它的所有数放到它右边,小于它的所有数放到它左边。之后比较该中枢的最后位置i与k的大小,若i比k小,说明第k小的元素在i的右半段,之后对i的右半段进行快速选择;若i比k大,说明第k小的元素在i的左半段,之后对i的左半段进行快速选择;若i正好等于k,则直接返回......。

下面是具体的算法步骤:

1,选择中枢:如下,为了提高快速选择的效率,最好尽可能的选择数值居中的数作为中枢。如1 7 2 8 4 3,则取头尾以及中间位置,然后选择(1, 2, 3)中的2

int median3(int nums[], int left, int right){
	int center = (left + right) / 2;
	if(nums[left] > nums[center])
		swap(nums[left], nums[center]);
	if(nums[left] > nums[right])
		swap(nums[left], nums[right]);
	if(nums[center] > nums[right])
		swap(nums[center], nums[right]);//此时nums[left] <= nums[center] <= nums[right]
	swap(nums[center], nums[right-1]);//交换中枢和a[right-1],此时上面三个值的居中的数在下标right-1处,然后返回中枢,由于a[right]必定比中枢大,故只需对区间[left, right-1]以中枢a[right-1]进行一次快速排序即可。
	return nums[right-1];
}

2,对区间[left, right-1]以中枢nums[right-1]进行一次快速排序,之后大于nums[right-1]的数全在它的右边,小于nums[right-1]的数全在它的左边

int pivot = nums[right-1], i = left, j = right-1;
while(i < j){
	while(nums[i] < pivot && i < j) ++i;
	nums[j] = nums[i];
	while(nums[j] >= pivot && i < j) --j;
	nums[i] = nums[j];
}
nums[i] = pivot;

3,比较i和k的大小:若求序列中的第k大的数,现在由步骤2已经知道一次选择排序后的中枢下标为i,说明前面i个数比pivot大,后面right-i个数比pivot大。
如果k < i,说明第k大的数在前面i个数中;如果k > i,说明第k大的数在后面的right-i中;如果i==k,直接返回答案。对于前两种情况只需要对pivot的左半段或者右半段中寻找即可,即:

if(k < i)
	QuickSelect(nums, k, 0, i-1);
else if(k > i)
	QuickSelect(nums, k, i+1, right);
else
	return nums[i];

完整代码如下:

#include <iostream>
using namespace std;
int median3(int nums[], int left, int right){
	int center = (left + right) / 2;
	if(nums[left] > nums[center])
		swap(nums[left], nums[center]);
	if(nums[left] > nums[right])
		swap(nums[left], nums[right]);
	if(nums[center] > nums[right])
		swap(nums[center], nums[right]);//此时nums[left] <= nums[center] <= nums[right]
	swap(nums[center], nums[right-1]);//交换中枢和a[right-1],此时上面三个值的居中的数在下标right-1处,然后返回中枢,由于a[right]必定比中枢大,故只需对区间[left, right-1]以中枢a[right-1]进行一次快速排序即可。
	return nums[right-1];
}

int QuickSelect(int nums[], int k, int left, int right){
	int pivot = median3(nums, left, right), i = left, j = right-1;
	while(i < j){
		while(nums[i] < pivot && i < j) ++i;
		nums[j] = nums[i];
		while(nums[j] >= pivot && i < j) --j;
		nums[i] = nums[j];
	}
	nums[i] = pivot;
	if(k < i)
		QuickSelect(nums, k, 0, i-1);
	else if(k > i)
		QuickSelect(nums, k, i+1, right);
	else
		return nums[i];
}

int main(){
	int k, nums[12] = {4, 5, 23, 12, 89, 20, 14, 23, 54, 66, 47, 23};
	while(cin >> k)
		cout << QuickSelect(nums, k-1, 0, 11) << endl;//第k大的数下标应为k-1
	return 0;
}

运行结果如下:



时间复杂度:每次尽可能的遍历数组的一半,故平均情况下的时间复杂度为O(n/2) + O(n/4) + O(n/8) + ... +O(1) = O(n)

猜你喜欢

转载自blog.csdn.net/qibofang/article/details/51953338
今日推荐