二つの文字列間の類似度を取得するJava

これは非常に便利な機能です。

この方法は、二つの文字列の類似度がfloat型の戻り値を返し、計算された、2つの文字列が通過する必要があります。

いくつかのテスト結果を初めて目

文字列1:「親愛なる友人、こんにちはみなさんの朝。」
文字列2:「親愛なる友人、こんにちは、夜は誰も。」

リターン結果:92.30769

文字列1:「親愛なる友人、こんにちはみなさんの朝。」
文字列2:「夜のみなさん、こんにちは。」

リターン結果:38.461536

文字列1:「みなさんこんにちは夜、音と非常に野心を残し医学大学院プール、ない仕事物事を正しく、書き込み、ギャップを埋めるために、著者の文体と話を話し、角を曲がっ、有名な有利難しいです。 「
文字列2:」夜のみなさん、こんにちは」。

リターン結果:7.936507

文字列1 :.「ビッグこんばんは」
文字列2:「夜のみなさん、こんにちは。」

リターン結果:0.0

「.....シャンハオの後期後期深夜遅くにはるかに誰も、誰も、誰も良い良い」:文字列1つの
文字列2:「夜のみなさん、こんにちは」

リターン結果:20.0

これらのいくつかの例では、我々は、このアプローチは、任意の効果を持っていることを見ることができるはずです。

コードは以下の通りであります:

public static float getSimilarityRatio(String str, String target) {

	int d[][]; // 矩阵
	int n = str.length();
	int m = target.length();
	int i; // 遍历str的
	int j; // 遍历target的
	char ch1; // str的
	char ch2; // target的
	int temp; // 记录相同字符,在某个矩阵位置值的增量,不是0就是1
	if (n == 0 || m == 0) {
		return 0;
	}
	d = new int[n + 1][m + 1];
	for (i = 0; i <= n; i++) { // 初始化第一列
		d[i][0] = i;
	}

	for (j = 0; j <= m; j++) { // 初始化第一行
		d[0][j] = j;
	}

	for (i = 1; i <= n; i++) { // 遍历str
		ch1 = str.charAt(i - 1);
		// 去匹配target
		for (j = 1; j <= m; j++) {
			ch2 = target.charAt(j - 1);
			if (ch1 == ch2 || ch1 == ch2 + 32 || ch1 + 32 == ch2) {
				temp = 0;
			} else {
				temp = 1;
			}
			// 左边+1,上边+1, 左上角+temp取最小
			d[i][j] = Math.min(Math.min(d[i - 1][j] + 1, d[i][j - 1] + 1), d[i - 1][j - 1] + temp);
		}
	}

	return (1 - (float) d[n][m] / Math.max(str.length(), target.length())) * 100F;
}~~~~
この方法は、直接使用することができます。

おすすめ

転載: www.cnblogs.com/shangyangyang/p/11350322.html