1. 二分查找(⭐)
要求
- 能够用自己语言描述二分查找算法
- 能够手写二分查找代码
- 能够解答一些变化后的考法
二分查找代码算法思路
-
前提:有已排序数组 A(假设已经做好)
-
定义左边界 L、右边界 R,确定搜索范围,循环执行二分查找(3、4两步)
-
获取中间索引 M = (L+R) /2
-
中间索引的值 A[M] 与待搜索的值 T 进行比较
① A[M] == T 表示找到,返回中间索引
② A[M] > T,中间值右侧的其它元素都大于 T,无需比较,中间索引左边去找,M - 1 设置为右边界,重新查找
③ A[M] < T,中间值左侧的其它元素都小于 T,无需比较,中间索引右边去找, M + 1 设置为左边界,重新查找
-
当 L > R 时,表示没有找到,应结束循环
代码实现
下面这个算法是基于Arrays.binarySearch实现的。
public class BinarySearch {
public static void main(String[] args) {
int[] a = {
9, 3, 7, 2, 5, 8, 1, 4};
Arrays.sort(a);
int index = binarySearch(a, 7);
System.out.println(index);
}
private static int binarySearch(int[] a, int target) {
int l = 0, r = a.length - 1, mid;
while (l <= r) {
// 等价于(l+r)/2,但是如果r是Integer.MAX_VALUE的话,可能会导致溢出。
mid = (l + r) >>> 1;
// a[mid]与target相同
if (a[mid] == target) {
return mid;
}
// a[mid]比target大,说明在左边
if (a[mid] > target) {
r = mid - 1;
}
// a[mid]比target小,说明在右边
if (a[mid] < target) {
l = mid + 1;
}
}
return -1;
}
}
选择题考法
口诀:奇数二分取中间,偶数二分取中间靠左
-
有一个有序表为 1,5,8,11,19,22,31,35,40,45,48,49,50 当二分查找值为 48 的结点时,查找成功需要比较的次数
-
使用二分法在序列 1,4,6,7,15,33,39,50,64,78,75,81,89,96 中查找元素 81 时,需要经过( )次比较
-
在拥有128个元素的数组中二分查找一个数,需要比较的次数最多不超过多少次
对于前两个题目,记得一个简要判断口诀:奇数二分取中间,偶数二分取中间靠左。对于后一道题目,需要知道公式:n = log2^N 所以说,128个元素需要7次,其中 n 为查找次数,N 为元素个数
2. 冒泡排序(⭐)
要求
- 能够用自己语言描述冒泡排序算法
- 能够手写冒泡排序代码
- 了解一些冒泡排序的优化手段
冒泡排序算法思路
- 依次比较数组中相邻两个元素大小,若 a[j] > a[j+1],则交换两个元素,两两都比较一遍称为一轮冒泡,结果是让最大的元素排至最后
- 重复以上步骤,直到整个数组有序
代码实现
public class BubbleSort {
public static void main(String[] args) {
int[] a = {
9, 3, 7, 2, 5, 8, 1, 4};
bubbleSort(a);
}
private static void bubbleSort(int[] a) {
// 循环次数只用循环a.length-1次,比如说8个元素,只用循环7次即可排序完成。
for (int j = 0; j < a.length - 1; j++) {
// 记录是否进行交换,如果没不再交换了就直接退出循环。
boolean flag = false;
// 只用比较a.length-1-j次,因为有j个数已经排好了,没必要进行比较了。
for (int i = 0; i < a.length - 1 - j; i++) {
if (a[i] > a[i + 1]) {
swap(a, i, i + 1);
flag = true;
}
}
// 如果这一遍循环没有进行交换,则说明数组已经排序好了,则直接退出循环。
if (!flag) {
break;
}
System.out.println(Arrays.toString(a));
}
}
private static void swap(int[] a, int i, int j) {
int temp = a[i];
a[i] = a[j];
a[j] = temp;
}
}
- 优化点1:每经过一轮冒泡,内层循环就可以减少一次(通过内层循环条件 -j 来实现)
- 优化点2:如果某一轮冒泡没有发生交换,则表示所有数据有序,可以结束外层循环(设置标记变量来实现)
进一步优化
public static void bubble_v2(int[] a) {
int n = a.length - 1;
while (true) {
int last = 0; // 表示最后一次交换索引位置
for (int i = 0; i < n; i++) {
System.out.println("比较次数" + i);
if (a[i] > a[i + 1]) {
Utils.swap(a, i, i + 1);
last = i;
}
}
n = last;
System.out.println("第轮冒泡"
+ Arrays.toString(a));
if (n == 0) {
break;
}
}
}
- 每轮冒泡时,最后一次交换索引可以作为下一轮冒泡的比较次数,如果这个值为零,表示整个数组有序,直接退出外层循环即可
3. 选择排序(不稳定)
要求
- 能够用自己语言描述选择排序算法
- 能够比较选择排序与冒泡排序
- 理解非稳定排序与稳定排序
选择排序算法思路
-
将数组分为两个子集,已排序的和未排序的,每一轮从未排序的子集中选出最小的元素,放入排序子集
-
重复以上步骤,直到整个数组有序
代码实现
public class SelectionSort {
public static void main(String[] args) {
int[] a = {
9, 3, 7, 2, 5, 8, 1, 4};
selectionSort(a);
}
private static void selectionSort(int[] a) {
// 只用循环a.length-1次,比如说8个元素,只用循环7次即可排序完成。
// i变量代表着每轮选择的最小元素要放到的索引位置。
for (int i = 0; i < a.length - 1; i++) {
// 每轮循环找到的最小元素,初始值从i开始
int num = i;
// 从当前元素开始,与后面所有元素进行比较,选出最小的元素。
for (int j = num + 1; j < a.length; j++) {
// 如果遍历到某个元素比a[num]小,则将该元素下标赋值给num
if (a[num] > a[j]) {
num = j;
}
}
if (num != i) {
// 将这次循环找到的最小的元素放入i位置。
swap(a, num, i);
}
System.out.println(Arrays.toString(a));
}
}
private static void swap(int[] a, int i, int j) {
int temp = a[i];
a[i] = a[j];
a[j] = temp;
}
}
- 优化点:为减少交换次数,每一轮可以先找最小的索引,在每轮最后再交换元素
冒泡排序 vs 选择排序
- 二者平均时间复杂度都是 O(n^2)
- 选择排序一般要快于冒泡,因为其交换次数少(记录下标形式) 插入 > 选择 > 冒泡
- 但如果集合有序度高,冒泡优于选择
4. 插入排序
要求
- 能够用自己语言描述插入排序算法
- 能够比较插入排序与选择排序
插入排序算法思路
-
将数组分为两个区域,排序区域和未排序区域,每一轮从未排序区域中取出第一个元素,插入到排序区域(需保证顺序)
-
重复以上步骤,直到整个数组有序
代码实现
public class InsertSort {
public static void main(String[] args) {
int[] a = {
9, 3, 7, 2, 5, 8, 1, 4};
insertSort(a);
}
private static void insertSort(int[] a) {
// i代表待插入元素的索引,从第二个元素开始,也就是下标为1的元素开始遍历。
for (int i = 1; i < a.length; i++) {
// 代表待插入的元素值
int target = a[i];
// sortedIndex代表已经排好序的元素末尾索引,初始值为i-1
int sortedIndex = i - 1;
for (; sortedIndex >= 0; sortedIndex--) {
// 将新元素与前面的元素一个个比较,如果小于前面的元素
if (target < a[sortedIndex]) {
// 前面的元素就往后移一位。
a[sortedIndex + 1] = a[sortedIndex];
} else {
// 退出循环,减少比较次数。
break;
}
}
a[sortedIndex + 1] = target;
System.out.println(Arrays.toString(a));
}
}
}
插入排序 vs 选择排序
- 二者平均时间复杂度都是 O(n^2)
- 大部分时间,插入都略优于选择。 插入 > 选择 > 冒泡
- 有序集合的插入时间复杂度为O(n)
优点:小数据量排序,都会优先选择插入排序
5. 希尔排序(不稳定)
要求
- 能够用自己语言描述希尔排序算法
希尔排序算法思路
-
首先选取一个间隙序列,如 (n/2,n/4 … 1),n 为数组长度
-
每一轮将间隙相等的元素视为一组,对组内元素进行插入排序,目的有二
① 少量元素插入排序速度很快
② 让组内值较大的元素更快地移动到后方
-
当间隙逐渐减少,直至为 1 时,即可完成排序
6. 快速排序(不稳定⭐)
要求
- 能够用自己语言描述快速排序算法
- 掌握手写单边循环、双边循环代码之一
- 能够说明快排特点
- 了解洛穆托与霍尔两种分区方案的性能比较
快速排序算法思路(总)
-
- 让小于基准点的元素的进入一个分区,大于基准点的元素的进入另一个分区
- 当分区完成时,基准点元素的位置就是其最终位置
- 在子分区内重复以上过程,直至子分区元素个数少于等于 1,这体现的是分而治之的思想
- 从以上描述可以看出,一个关键在于分区算法,常见的有洛穆托分区方案、双边循环分区方案、霍尔分区方案
单边循环快排(lomuto 洛穆托分区方案)
-
选择最右元素作为基准点元素
-
j 指针负责找到比基准点小的元素,一旦找到则与 i 进行交换
-
i 指针维护小于基准点元素的边界,也是每次交换的目标索引
-
最后基准点与 i 交换,i 即为分区位置
public class QuickSort1 {
public static void main(String[] args) {
int[] a = {
9, 3, 7, 2, 5, 8, 1, 4};
quickSort(a, 0, a.length - 1);
System.out.println(Arrays.toString(a));
}
private static void quickSort(int[] a, int low, int high) {
// 如果区间内没有元素,则直接return
if (low >= high) {
return;
}
// p是基准的索引值
int p = partition(a, low, high);
// 左边分区的递归
quickSort(a, low, p - 1);
// 右边分区的递归
quickSort(a, p + 1, high);
}
/**
* @param low 数组的左边界
* @param high 数组的右边界
*/
private static int partition(int[] a, int low, int high) {
// pivot是基准点元素,这里选择数组最右边的元素作为基准点
int pivot = a[high];
int i = low;
for (int j = low; j < high; j++) {
// 如果当前元素小于pivot,就让i与j互换
if (a[j] < pivot) {
swap(a, i, j);
i++;
}
}
// 交换i与pivot,让基准点左边全是小于pivot的,右边全是大于pivot的。
swap(a, high, i);
return i;
}
private static void swap(int[] a, int i, int j) {
int temp = a[i];
a[i] = a[j];
a[j] = temp;
}
}
双边循环快排(不完全等价于 hoare 霍尔分区方案)
- 选择最左元素作为基准点元素
- j 指针负责从右向左找比基准点小的元素
- i 指针负责从左向右找比基准点大的元素,一旦找到二者交换,直至 i,j 相交
- 最后基准点与 i(此时 i 与 j 相等)交换,i 即为分区位置
要点
- 基准点在左边,并且要先 j 后 i
- while( i < j && a[j] > pivot ) j–
- while ( i < j && a[i] <= pivot ) i++
为什么内层循环还需要判断i<j
如果数组为[5,1,2,3,6,7,8],先j–,从后往前找到3后,再i++找,找到6后,再交换,此时会出现问题。
public class QuickSort2 {
public static void main(String[] args) {
int[] a = {
9, 3, 7, 2, 5, 8, 1, 4};
quickSort(a, 0, a.length - 1);
System.out.println(Arrays.toString(a));
}
private static void quickSort(int[] a, int low, int high) {
// 如果区间内没有元素,则直接return
if (low >= high) {
return;
}
// p是基准的索引值
int p = partition(a, low, high);
// 左边分区的递归
quickSort(a, low, p - 1);
// 右边分区的递归
quickSort(a, p + 1, high);
}
private static int partition(int[] a, int low, int high) {
// 以左边的为基准元素
int pivot = a[low];
int i = low;
int j = high;
while (i < j) {
// j 从右边开始,找比pivot小的元素下标
while (i < j && a[j] > pivot) {
j--;
}
// i 从左边开始,找比pivot大的元素下标
while (i < j && a[i] <= pivot) {
i++;
}
swap(a, i, j);
}
// 将基准元素与j/i进行交换,此时i与j指向的是同一元素。
swap(a, low, j);
System.out.println(Arrays.toString(a));
return j;
}
private static void swap(int[] a, int i, int j) {
int temp = a[i];
a[i] = a[j];
a[j] = temp;
}
}
快排特点
-
平均时间复杂度是 O(nlog2^n ),最坏时间复杂度 O(n^2)
-
数据量较大时,优势非常明显
洛穆托分区方案 vs 霍尔分区方案
- 霍尔的移动次数平均来讲比洛穆托少3倍
稳定排序和不稳定排序
稳定排序指,按对象中不同字段进行多次排序(如先按花色排序再按大小排序),不会打乱同值元素的顺序,不稳定排序则反之。