基数排序(桶排序)
基本介绍
- 基数排序(radix sort)属于“分配式排序”(distribution sort),又称“桶子法”(bucket sort)或bin sort,顾名思义,它是通过键值的各个位的值,将要排序的元素分配至某些“桶”中,达到排序的作用。
- 基数排序法是属于稳定性的排序,基数排序法是效率最高的稳定性排序法
- 基数排序(Radix Sort)是桶排序的扩展
- 基数排序是1887年赫尔曼·何乐礼发明的。它是这样实现的:将整数按位数切割成为不同的数子,然后按照每个位数分别比较。
基数排序基本思想
将所有带比较数值统一为同样的数位长度,数位较短的数前面补零。然后,从最低位开始,依次进行一次排序。这样从最低位排序一直到最高位排序完成以后,数列就变成了一个有序序列。
过程理解
第一轮
第二轮
第三轮
个人理解
我认为还是比较好理解的,个人理解为:第一次排序比较个位,第二次比较十位,第三次比较百位,依此类推,这种排序和最大数的位数有着很大的联系。
代码实现
package sort;
import java.text.SimpleDateFormat;
import java.util.Date;
public class RadixSort {
public static void main(String[] args) {
//int[] arr = {53,3,542,748,14,214};
//测试基数排序速度,给80000个数据,测试
//创建一个80000个随机的数组
int[] arr = new int[80000];
for (int i = 0;i < 80000;i ++) {
//会生成一个[0,8000000]的数
arr[i] = (int)(Math.random() * 8000000);
}
//System.out.println("最开始的数组为:" + Arrays.toString(arr));
Date date1 = new Date();
SimpleDateFormat simpleDateFormat1 = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
String date1Str = simpleDateFormat1.format(date1);
System.out.println("排序前的时间:" + date1Str);
//测试基数排序
radixSort(arr);
Date date2 = new Date();
String date2Str = simpleDateFormat1.format(date2);
System.out.println("排序后的时间:" + date2Str);
}
//基数排序方法
public static void radixSort(int[] arr) {
//1.得到数组中最大的位数
int max = arr[0];//假设第一个数就是最大数
for (int i = 1; i < arr.length; i ++) {
if (arr[i] > max) {
max = arr[i];
}
}
//得到最大位数是几位数
int maxLength = (max + "").length();
//定义一个二维数组,表示10个桶子,每个桶子就是一个一维数组
//说明
//1.二维数组包含10个一维数组
//2.为了防止在放数的时候数据溢出,则每个一维数组(桶子)大小定义为arr.length
//3.明确,基数排序是使用空间换时间的经典算法
int[][] bucket = new int[10][arr.length];
//为了记录每个桶中,实际存放了多少个数据,,我们定义一个一维数组来记录各个桶的每次放入的数据个数
int[] bucketElementCounts = new int[10];
for (int i = 0,n = 1;i < maxLength;i ++,n*=10) {
//针对每个元素对应位,进行排序处理
for (int j = 0;j < arr.length;j ++) {
//取出每个元素的对应位的值
int digitOfElement = arr[j] / n % 10;
//放入到对应的桶中
bucket[digitOfElement][bucketElementCounts[digitOfElement]] = arr[j];
bucketElementCounts[digitOfElement] ++;
}
//按照这个桶的顺序(一维数组的下标依次取出数据,放入到原来数组)
int index = 0;
//遍历每一个桶,并将桶中的数据,放入到原数据
for (int k = 0;k < bucketElementCounts.length;k ++) {
//如果桶中有数据,我们才放入到原数组
if (bucketElementCounts[k] != 0) {
//循环该桶即第k个桶,(即第k个一维数组)放入
for (int l = 0;l < bucketElementCounts[k];l ++) {
//取出元素放入到arr
arr[index ++] = bucket[k][l];
}
}
//每次处理后,需要重置为0
bucketElementCounts[k] = 0;
}
}
}
}
在基数排序中,文章内测试了80000个数据,但是可以自己多测试几个,我自己私下测试的时候,到达几千万数据的时候,已经出现了异常,盲猜应该是内存占用的问题吧,因为基数排序是典型的空间换时间的算法。
笔记源自:韩顺平数据结构与算法