これは非常に便利な機能です。
この方法は、二つの文字列の類似度がfloat型の戻り値を返し、計算された、2つの文字列が通過する必要があります。
いくつかのテスト結果を初めて目
文字列1:「親愛なる友人、こんにちはみなさんの朝。」
文字列2:「親愛なる友人、こんにちは、夜は誰も。」
リターン結果:92.30769
文字列1:「親愛なる友人、こんにちはみなさんの朝。」
文字列2:「夜のみなさん、こんにちは。」
リターン結果:38.461536
文字列1:「みなさんこんにちは夜、音と非常に野心を残し医学大学院プール、ない仕事物事を正しく、書き込み、ギャップを埋めるために、著者の文体と話を話し、角を曲がっ、有名な有利難しいです。 「
文字列2:」夜のみなさん、こんにちは」。
リターン結果:7.936507
文字列1 :.「ビッグこんばんは」
文字列2:「夜のみなさん、こんにちは。」
リターン結果:0.0
「.....シャンハオの後期後期深夜遅くにはるかに誰も、誰も、誰も良い良い」:文字列1つの
文字列2:「夜のみなさん、こんにちは」
リターン結果:20.0
これらのいくつかの例では、我々は、このアプローチは、任意の効果を持っていることを見ることができるはずです。
コードは以下の通りであります:
public static float getSimilarityRatio(String str, String target) {
int d[][]; // 矩阵
int n = str.length();
int m = target.length();
int i; // 遍历str的
int j; // 遍历target的
char ch1; // str的
char ch2; // target的
int temp; // 记录相同字符,在某个矩阵位置值的增量,不是0就是1
if (n == 0 || m == 0) {
return 0;
}
d = new int[n + 1][m + 1];
for (i = 0; i <= n; i++) { // 初始化第一列
d[i][0] = i;
}
for (j = 0; j <= m; j++) { // 初始化第一行
d[0][j] = j;
}
for (i = 1; i <= n; i++) { // 遍历str
ch1 = str.charAt(i - 1);
// 去匹配target
for (j = 1; j <= m; j++) {
ch2 = target.charAt(j - 1);
if (ch1 == ch2 || ch1 == ch2 + 32 || ch1 + 32 == ch2) {
temp = 0;
} else {
temp = 1;
}
// 左边+1,上边+1, 左上角+temp取最小
d[i][j] = Math.min(Math.min(d[i - 1][j] + 1, d[i][j - 1] + 1), d[i - 1][j - 1] + temp);
}
}
return (1 - (float) d[n][m] / Math.max(str.length(), target.length())) * 100F;
}~~~~