検索アルゴリズムの概要
Javaでは、一般的に使用される4つの検索があります。
- シーケンシャル(線形)検索
- バイナリ検索/バイナリ検索
- 補間ルックアップ
- フィボナッチ検索
線形検索アルゴリズム(順次検索アルゴリズム)
前書き
配列は整然としている必要はありません。
場合
名前がシーケンスに含まれているかどうかを判断するための番号シーケンス{1,8、10、89、1000、1234}があります[順次検索]要件:見つかった場合は、検索して添え字値を指定するように求められます。
アイデア:条件を満たす値を見つけて返す
コード
package search;
import java.util.ArrayList;
import java.util.List;
public class SeqSearch {
public static void main(String[] args) {
int[] arr = {
1, 7, 3, 11,11, -1, 34, 98};
int index = seqSearch(arr, 111);
List<Integer> result = seqSearchAll(arr, 11);
if (index == -1) {
System.out.println("没有找到");
} else {
System.out.println("找到了,下标 = " + result);
}
}
/**
* 这里我们实现的线性查找是找到一个满足条件的值就返回
*
* @param arr 查找数组
* @param value 查找的值
* @return 返回查找的值的下标
*/
public static int seqSearch(int[] arr, int value) {
// 线性查找是逐一比对,发现有相同的值时候,就返回下标
for (int i = 0; i < arr.length; i++) {
if (arr[i] == value) {
return i;
}
}
return -1;
}
public static List<Integer> seqSearchAll(int[] arr, int value) {
List<Integer> result = new ArrayList<>();
for (int i = 0; i < arr.length; i++) {
if (arr[i] == value) {
result.add(i);
}
}
return result;
}
}
バイナリ検索アルゴリズム
バイナリ検索思考分析
ケース1:条件を満たす最初の添え字を見つける
順序付けられた配列{1,8、10、89、1000、1234}でバイナリ検索を実行し、番号を入力してこの番号が配列に存在するかどうかを確認し、存在しない場合は「そのような番号はありません」というプロンプトが表示されます。 。
ケース2:最適化、条件を満たすすべての添え字を見つける
クラス後の考え:{1,8、10、89、1000、1000、1234}順序付けられた配列に複数の同一の値がある場合、ここで1000などのすべての値を見つける方法。
package search;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.List;
public class BinarySearch {
public static void main(String[] args) {
// 注意:使用二分查找的前提是数组有序的
int[] arr = {
1, 8, 10, 89, 1000, 1000, 1234};
// int index = binarySearch1(arr, 0, arr.length - 1, 895);
// System.out.println("index = " + index);
ArrayList<Integer> resultIndexList = binarySearch(arr, 0, arr.length - 1, 1000);
if (resultIndexList.size() == 0) {
System.out.println("没有找到");
} else {
for (int index:resultIndexList) {
System.out.print(index + " ");
}
}
}
/**
* (从小到大数组)二分查找算法
*
* @param arr 数组
* @param left 左边的索引
* @param right 右边的索引
* @param findValue 要查找的值
* @return 如果找到返回下标,如果没有找到,返回-1
*/
public static int binarySearch1(int[] arr, int left, int right, int findValue) {
// 当left > right 时候,说明递归了整个数组,但是没有找到
if (left > right) {
return -1;
}
int mid = (left + right) / 2;
int midVal = arr[mid];
if (findValue > arr[mid]) {
// 向右递归
return binarySearch1(arr, mid + 1, right, findValue);
} else if (findValue < arr[mid]) {
return binarySearch1(arr, left, mid - 1, findValue);
} else {
return mid;
}
}
/**
* (从小到大数组)二分查找算法
* 优化 查找全部可能的下标
* 思路分析:
* 1. 在找到mid值时,不要马上返回
* 2. 向mid索引值的左边扫描,将所有满足条件的结果值的下标加入一个集合中
* 3. 向mid索引值的右边扫描,将所有满足条件的结果值的下标加入一个集合中
* 4. 返回结果值
*
* @param arr 数组
* @param left 左边的索引
* @param right 右边的索引
* @param findValue 要查找的值
* @return 如果找到返回下标,如果没有找到,返回-1
*/
public static ArrayList<Integer> binarySearch(int[] arr, int left, int right, int findValue) {
// 当left > right 时候,说明递归了整个数组,但是没有找到
if (left > right) {
return new ArrayList<Integer>();
}
int mid = (left + right) / 2;
int midVal = arr[mid];
if (findValue > midVal) {
// 向右递归
return binarySearch(arr, mid + 1, right, findValue);
} else if (findValue < midVal) {
return binarySearch(arr, left, mid - 1, findValue);
} else {
ArrayList<Integer> resultIndexList = new ArrayList<Integer>();
// 向mid索引值的左边扫描,将所有满足条件的结果值的下标加入一个集合中
int temp = mid - 1;
while (true) {
if (temp < 0 || arr[temp] != findValue) {
// 退出
break;
}
// 否则,将temp放入到resultIndexList
resultIndexList.add(temp);
temp -= 1;// temp左移
}
resultIndexList.add(mid);
//向mid索引值的右边扫描,将所有满足条件的结果值的下标加入一个集合中
temp = mid + 1;
while (true) {
if (temp > arr.length - 1 || arr[temp] != findValue) {
// 退出
break;
}
// 否则,将temp放入到resultIndexList
resultIndexList.add(temp);
temp += 1;// temp右移
}
return resultIndexList;
}
}
}
補間ルックアップ
補間検索の原理の概要:
- 補間検索アルゴリズムはバイナリ検索に似ていますが、違いは、補間検索が毎回アダプティブミッドから開始されることです。
- ハーフサーチで中間インデックスを見つけるための式。lowは左インデックスを左、highは右インデックスを右を意味します。keyは前に説明したfindValです。
int mid = low + (high - low) * (key - arr[low]) / (arr[high] - arr[low]) ;
補間インデックス
は、前のコード式に対応しています。int mid = left + (right – left) * (findVal – arr[left]) / (arr[right] – arr[left])
- 補間検索アルゴリズム1-100アレイを説明する例を示します。
補間検索アプリケーションの場合:
順序付けられた配列{1,8、10、89、1000、1234}で補間検索を実行し、番号を入力してこの番号が配列に存在するかどうかを確認し、存在しない場合は「そのような番号はありません」というプロンプトが表示されます。 。
package search;
import java.util.Arrays;
public class InsertValueSearch {
public static void main(String[] args) {
int[] arr = new int[100];
for (int i = 0; i < 100; i++) {
arr[i] = i + 1;
}
// System.out.println(Arrays.toString(arr));
int index = insertValueSearch(arr,0,arr.length-1,100);
System.out.println(index);
}
/**
* 插值查找算法
* 插值查找算法也要求数组有序
*
* @param arr 数组
* @param left 左边索引
* @param right 右边索引
* @param findValue 查找的值
* @return 找到返回下标,找不到返回-1
*/
public static int insertValueSearch(int[] arr, int left, int right, int findValue) {
// findValue < arr[0] || findValue > arr[arr.length - 1] 必须有
// 否则我们得到的mid可能越界
if (left > right || findValue < arr[0] || findValue > arr[arr.length - 1]) {
return -1;
}
// 求出mid
int mid = left + (right - left) * (findValue - arr[left]) / (arr[right] - arr[left]);
int midVal = arr[mid];
if (findValue > midVal) {
return insertValueSearch(arr, mid + 1, right, findValue);
} else if (findValue < midVal) {
return insertValueSearch(arr, left, mid - 1, findValue);
} else{
return mid;
}
}
}
補間検索に関する注意:
- 大量のデータと比較的均一なキーワード分布を持つルックアップテーブルの場合、補間検索が使用されます。これは高速です。
- キーワードの分布が不均一な場合、この方法は必ずしもバイナリ検索よりも優れているとは限りません。
フィボナッチ(ゴールデンセクション)検索の基本的な紹介
-
金色のセクションは、全長に対する一方の部分の比率がこの部分に対するもう一方の部分の比率と等しくなるように、ラインセグメントを2つの部分に分割することを指します。最初の3桁のおおよその値は0.618です。この比率で設計された形状は非常に美しいため、ゴールデン比率と呼ばれ、中国と海外の比率としても知られています。これは魔法の数字であり、意図的な効果はほとんどありません。
-
フィボナッチシーケンス{1、1、2、3、5、8、13、21、34、55}は、フィボナッチシーケンス内の2つの隣接する数値の比率が、ゴールデンセクション値0.618に無限に近いことを発見しました。
フィボナッチ(ゴールデンセクション法)の原理
-
フィボナッチの検索原理は前の2つと似ていますが、中央のノード(mid)の位置を変更するだけです。midは中央になく、補間されていませんが、ゴールデンセクションポイントの近くにあります。つまり、mid = low + F(k- 1)-1(FはFibonacciシーケンスを表します)、次の図に示すように
-
F(k-1)-1の理解:
フィボナッチシーケンスF [k] = F [k-1] + F [k-2]の性質から、(F [k] -1)=を得ることができます。 (F [k-1] -1)+(F [k-2] -1)+1。この式は次のように説明します。シーケンステーブルの長さがF [k] -1である限り、テーブルは、上の図に示すように、長さがF [k-1] -1とF [k-2] -1の2つのセクションに分割できます。公演。したがって、中央の位置はmid = low + F(k-1)-1です。 -
同様に、各サブセグメントも同じ方法で分割できます
が、シーケンステーブルの長さnはF [k] -1と正確に等しくない場合があるため、元のシーケンステーブルの長さnをF [k] -1に増やす必要があります。ここでのk値は、F [k] -1をn以上にする必要があるだけです。これは、次のコードで取得されます。シーケンステーブルの長さが長くなると、新しい位置(n +1からF [k] -1の位置)になります。 、n位置の値に割り当てることができます。
フィボナッチ検索アプリケーションの例:
順序付けられた配列に対してFibonacci検索{1,8、10、89、1000、1234}を実行し、番号を入力してこの番号が配列に存在するかどうかを確認し、添え字を見つけてください。存在しない場合は、「いいえ」というプロンプトが表示されます。この番号"。
コード
package search;
import java.util.Arrays;
public class FibonacciSearch {
public static int maxSize = 20;
public static void main(String[] args) {
int[] arr = {
1, 8, 10, 89, 1000, 1234};
System.out.println(fibSearch(arr,879));
}
// 因为后面我们mid = low +F(k-1)-1
// 需要使用斐波那契数列,因此我们需要先获取到一个斐波那契数列
// 使用非递归方式得到一个斐波那契数列
public static int[] fib() {
int[] f = new int[maxSize];
f[0] = 1;
f[1] = 1;
for (int i = 2; i < maxSize; i++) {
f[i] = f[i - 1] + f[i - 2];
}
return f;
}
/**
* 使用非递归方式编写斐波那契查找算法
*
* @param a 数组
* @param key 我们需要查找的关键码(值)
* @return 找到返回下标,没有返回-1
*/
public static int fibSearch(int[] a, int key) {
int low = 0;
int high = a.length - 1;
int k = 0; // 表示斐波那契分割数值的下标
int mid = 0; // 存放mid值
int[] f = fib(); // 获取到斐波那契序列
// 获取到斐波那契分割树枝的下标
while (high > f[k] - 1) {
k++;
}
// 因为f[k]的值可能大于数组a的长度,因此我们需要使用Arrays类,构造一个新的数组,并指向temp[]
// 不足的部分会使用0填充
int[] temp = Arrays.copyOf(a, f[k]);
// 实际上不能用0填充,需要使用a数组最后的数填充temp
for (int i = high + 1; i < temp.length; i++) {
temp[i] = a[high];
}
// 使用while循环来处理,找到数key
while (low <= high) {
// 只要条件满足,就一直找
mid = low + f[k - 1] - 1;
if (key < temp[mid]) {
// 我们应该继续向数组前面查找(左边)
high = mid - 1;
// 为什么k--?
// 说明
// 1. 全部元素 = 前面的元素 + 后面的元素
// 2. f[k] = f[k-1] + f[k-2]
// 因为前面有f[k-1]个元素,所以我们可以继续拆分f[k-1] = f[k-2] + f[k-3]
// 即在f[k-1]的前面继续查找 k--
// 即下次mid = f[k-1-1] -1
k--;
} else if (key > temp[mid]) {
low = mid + 1;
// 为什么k-=2
// 说明
// 1. 全部元素 = 前面的元素 + 后面的元素
// 2. f[k] = f[k-1] + f[k-2]
// 3. 因为后面有f[k-2]个元素,所以可以继续拆分f[k-1] = f[k-3] + f[k-4]
// 4. 即在f[k-2]的前面进行查找 k-=2
// 5. 即下次循环 mid = f[k-1-2] -2
k-=2;
}else{
// 找到
// 需要确定返回的是哪个下标
if(mid <= high){
return mid;
}else {
return high;
}
}
}
return -1;
}
}