一般的に使用される4つの検索アルゴリズム:
- シーケンシャル(線形)検索
- 二分探索/二分探索
- フィボナッチ検索
1.線形探索
数列:{1,8,10,89,1000,1234}、名前がシーケンスに含まれているかどうかを判断する(順次検索)、要件:見つかった場合は、名前を見つけるように求め、添え字の値を指定します。
コード
package com.lele.search;
/**
* author: hwl
* date: 2020/10/20 21:36
* version: 1.0.0
* modified by:
* description:
*/
public class SeqSearch {
public static void main(String[] args) {
int[] arr = {
1,9,11,-1,34,89};// 没有顺序的数组
int index = seqSearch(arr, 11);
if (index == -1) {
System.out.println("没有找到");
} else {
System.out.println("找到,下标为:" + index);
}
}
/**
* 找到一个满足条件的值,就返回
* @param arr
* @param value
* @return
*/
public static int seqSearch(int[] arr, int value) {
// 线性查找是逐一比对,发现有相同值,就返回下标
for (int i = 0; i < arr.length; i++) {
if (arr[i] == value) {
return i;
}
}
return -1;
}
}
2.二分探索
順序付けられた配列でバイナリ検索{1,8,10,89,1000,1234}を実行し、番号を入力してその番号が配列に存在するかどうかを確認し、添え字を見つけてください。そのような番号がない場合は、 「そのような番号はありません」というプロンプトが表示されます。
アイデア
コードの実装
package com.lele.search;
import java.util.ArrayList;
import java.util.List;
/**
* author: hwl
* date: 2020/10/21 21:08
* version: 1.0.0
* modified by:
* description:
*/
public class BinarySearch {
public static void main(String[] args) {
int[] arr = {
1,8,10,89,1000,1000,1000,1234};
//
// int resIndex = binarySearch(arr, 0, arr.length - 1, 1000);
// System.out.println("resIndex=" + resIndex);
List<Integer> resIndexList = binarySearch2(arr, 0, arr.length - 1, 1000);
System.out.println("resIndexList=" + resIndexList);
}
/**
* 二分查找
* @param arr 数组
* @param left 左边的索引
* @param right 右边的索引
* @param findVal 要查找的值
* @return 如果找到就返回下标,如果没有找到,就返回 -1
*/
public static int binarySearch(int[] arr, int left, int right, int findVal) {
// 当 left > right 时,说明递归整个数组,但没有找到
if (left > right) {
return -1;
}
int mid = (left + right) / 2;
int midVal = arr[mid];
if (findVal > midVal) {
// 向右递归
return binarySearch(arr, mid + 1, right, findVal);
} else if (findVal < midVal) {
// 向左递归
return binarySearch(arr, left, mid - 1, findVal);
} else {
return mid;
}
}
/**
* 一个有序数组中有多个相同的数值,如何将所有的数值都查找到
* 思路分析:
* 1.在找到mid索引值,不要马上返回;
* 2.向mid索引值的左边扫描,将所有满足1000的元素的下标,加入到集合 ArrayList
* 3.向mid索引值得右边扫描,将所有满足 1000的元素的下标,加入到集合 ArrayList
* 4.将ArrayList返回
*
* @param arr
* @param left
* @param right
* @param findVal
* @return
*/
public static List<Integer> binarySearch2(int[] arr, int left, int right, int findVal) {
if (left > right) {
return new ArrayList<Integer>();
}
int mid = (left + right) / 2;
int midVal = arr[mid];
if (findVal > midVal) {
// 向右递归
return binarySearch2(arr, mid + 1, right, findVal);
} else if (findVal < midVal) {
// 向左递归
return binarySearch2(arr, left, mid - 1, findVal);
} else {
List<Integer> resIndexList = new ArrayList<>();
// 向mid索引值得左边扫描,将所有满足1000的元素下标,加入到集合ArrayList
int temp = mid - 1;
while(true) {
if (temp < 0 || arr[temp] != findVal) {
break;
}
// 否则,就将temp放入到 resIndexList
resIndexList.add(temp);
temp--;
}
resIndexList.add(mid);
temp = mid + 1;
while(true) {
if (temp > arr.length - 1 || arr[temp] != findVal) {
break;
}
resIndexList.add(temp);
temp++;
}
return resIndexList;
}
}
}
3.補間検索
補間検索アルゴリズムは二分探索に似ていますが、違いは、補間検索が毎回適応中間から開始されることです。
分岐検索で中間インデックスを見つけるための式。lowは左のインデックスを表し、highは右のインデックスを表します。キーはfindValです。
アプリケーションケース
順序付けられた配列{1,8,10,89,1000,1234}を補間して検索し、番号を入力してその番号が配列に存在するかどうかを確認し、添え字を見つけてください。存在しない場合は、「あります。そのような番号はありません」
コード
package com.lele.search;
/**
* author: hwl
* date: 2020/10/23 7:30
* version: 1.0.0
* modified by:
* description:
*/
public class InsertValueSearch {
public static void main(String[] args) {
int[] arr = new int[100];
for (int i = 0; i < 100; i++) {
arr[i] = i + 1;
}
// int arr[] = {1,8,10,89,1000,1000,1234};
int index = insertValueSearch(arr,0, arr.length - 1, 34);
System.out.println("index = " + index);
}
/**
* 插值查找算法,也要求数组有序
* @param arr 数组
* @param left 左边索引
* @param right 右边索引
* @param findVal 查找值
* @return 如果找到,就返回对应的下标,如果没有找到,就返回-1
*/
public static int insertValueSearch(int[] arr, int left, int right, int findVal) {
// findVal < arr[0] 和 findVal > arr[arr.length - 1],避免数组越界
if (left > right || findVal < arr[0] || findVal > arr[arr.length - 1]) {
return -1;
}
// 求出 mid,自适应
int mid = left + (right - left) * (findVal - arr[left]) / (arr[right] - arr[left]);
int midVal = arr[mid];
if (findVal > midVal) {
return insertValueSearch(arr, mid + 1, right, findVal);
} else if (findVal < midVal) {
return insertValueSearch(arr, left, mid - 1, findVal);
} else {
return mid;
}
}
}
注意:
- 大量のデータと比較的均一なキーワード分布を持つルックアップテーブルの場合、補間検索が使用されます。これは高速です。
- キーワードの分布が不均一な場合、この方法は必ずしも二分探索よりも優れているとは限りません。
4.フィボナッチ(黄金分割)検索アルゴリズム
黄金分割とは、全長に対する一方の部分の比率がこの部分に対するもう一方の部分の比率と等しくなるように、線分を2つの部分に分割することを指します。最初の3桁のおおよその値は0.618です。この比率でデザインされた形はとても美しいので、黄金比と呼ばれ、中国と外国の比率としても知られています。これは、予期しない結果をもたらすマジックナンバーです。
フィボナッチ数列{1,1,2,3,5,813,21,34,55}では、列内の2つの隣接する数値の比率は、黄金分割値0.618に無限に近くなります。
フィボナッチ検索の原理は最初の2つと似ていますが、中央のノード(mid)の位置を変更するだけで、midは中央にないか補間されていませんが、黄金分割点の近くにあります。つまり、mid = low + F (k-1)-1(Fはフィボナッチ数列を表します)、次の図に示すように。
F(k-1)-1の理解:
- フィボナッチ数列F [k] = F [k-1] + F [k-2]のプロパティを使用すると、(F(k)-1)=(F [k-1] -1)+(F [k-2] -1)+1。この式は次のように説明します。シーケンステーブルの長さがF [k] -1である限り、テーブルは長さがF [k-1] -1とF [k-2] -1の2つのセクションに分割できます。上の図に示されています。したがって、中央の位置はmid = low + F(k-1)-1です。
- 同様に、各サブセグメントも同じ方法で分割できます。
- ただし、シーケンス長nは必ずしもF [k] -1に等しいとは限らないため、元のシーケンステーブル長nをF [k] -1に増やす必要があります。ここでのkの値は、F [k] -1をn以上にする必要があるだけです。これは、次のコードで取得できます。シーケンステーブルの長さが長くなると、新しく追加された位置(n + 1から) F [k] -1の位置)、すべてが位置nの値に割り当てられます。
while(n > fib(k)-1) {
k++;
}
コード
package com.lele.search;
import java.util.Arrays;
/**
* author: hwl
* date: 2020/10/24 11:13
* version: 1.0.0
* modified by:
* description:
*/
public class FibonacciSearch {
public static int maxSize = 20;
public static void main(String[] args) {
int[] arr = {
1,8,10,89,1000,1234};
System.out.println("index=" + fibSearch(arr, 1234));
}
/**
* 因为后面我们 mid = low + F(k-1)-1,需要使用到斐波那契数列,因此需要先获取到一个斐波那契数列
* 非递归方法得到一个斐波那契数列
* @return
*/
public static int[] fib() {
int[] f = new int[maxSize];
f[0] = 1;
f[1] = 1;
for (int i = 2; i < maxSize; i++) {
f[i] = f[i - 1] + f[i - 2];
}
return f;
}
/**
* 编写斐波那契查找算法
* 使用非递归的方式编写算法
* @param a 数组
* @param key 需要查找的关键码(值)
* @return 返回对应的下标,如果没有,则返回-1
*/
public static int fibSearch(int[] a, int key) {
int low = 0;
int high = a.length - 1;
int k = 0;// 表示斐波那契分割数值的下标
int mid = 0;// 存放mid值
int f[] = fib(); // 获取到斐波那契数列
// 获取到斐波那契分割数值的下标
while(high > f[k] - 1) {
k++;
}
// 因为f[k]值 可能大于a的长度,因此我们需要使用Arrays类,构造一个新的数组,并指向temp[]
// 不足的部分会使用0填充
int[] temp = Arrays.copyOf(a, f[k]);
// 实际上需求使用a数组最后的数填充temp
// temp = {1,8,10,89,1000,1234,0,0} => {1,8,10,89,1000,1234,1234,1234}
for (int i = high + 1; i < temp.length; i++) {
temp[i] = a[high];
}
while (low <= high) {
mid = low + f[k - 1] - 1;
if (key < temp[mid]) {
// 向左查找
high = mid - 1;
/**
* 说明:
* 1. 全部元素 = 前面的元素 + 后面元素
* 2. f[k] = f[k-1]+f[k-2]
* 因为 前面有 f[k-1]个元素,所以可以继续拆分 f[k-1] = f[k-2]+f[k-3], 即 在 f[k-1] 的前面继续查找 k--
* 即 下次循环 mid = f[k-1-1]-1
*/
k--;
} else if (key > temp[mid]) {
// 继续向右查找
low = mid + 1;
/**
* 说明
* 1.全部元素 = 前面的元素 + 后面的元素
* 2.f[k] = f[k-1]+f[k-2]
* 3.因为后面我们有 f[k-2] 所以可以继续拆分 f[k-1] = f[k-3]+f[k-4]
* 4.即 在 f[k-2] 的前面进行查找 k-=2
* 5.即下次循环 mid = f[k-1-2] - 1
*/
k -= 2;
} else {
if (mid <= high) {
return mid;
} else {
return high;
}
}
}
return -1;
}
}