web-dev-qa-db-ja.com

2つの文字列の違いを見つける

2つの長い文字列があるとします。それらはほとんど同じです。

String a = "this is a example"
String b = "this is a examp"

上記のコードは一例です。実際の文字列は非常に長いです。

問題は、1つの文字列が2文字以上を持つことです。

これらの2つのキャラクターのどちらを確認できますか?

20
user17526

StringUtils.difference(String first、String second) を使用できます。

これが彼らの実装方法です。

public static String difference(String str1, String str2) {
    if (str1 == null) {
        return str2;
    }
    if (str2 == null) {
        return str1;
    }
    int at = indexOfDifference(str1, str2);
    if (at == INDEX_NOT_FOUND) {
        return EMPTY;
    }
    return str2.substring(at);
}

public static int indexOfDifference(CharSequence cs1, CharSequence cs2) {
    if (cs1 == cs2) {
        return INDEX_NOT_FOUND;
    }
    if (cs1 == null || cs2 == null) {
        return 0;
    }
    int i;
    for (i = 0; i < cs1.length() && i < cs2.length(); ++i) {
        if (cs1.charAt(i) != cs2.charAt(i)) {
            break;
        }
    }
    if (i < cs2.length() || i < cs1.length()) {
        return i;
    }
    return INDEX_NOT_FOUND;
}
26
JRL

2つの文字列の違いを見つけるには、StringUtilsクラスとdifferenceメソッド。 2つの文字列を比較し、それらが異なる部分を返します。

 StringUtils.difference(null, null) = null
 StringUtils.difference("", "") = ""
 StringUtils.difference("", "abc") = "abc"
 StringUtils.difference("abc", "") = ""
 StringUtils.difference("abc", "abc") = ""
 StringUtils.difference("ab", "abxyz") = "xyz"
 StringUtils.difference("abcde", "abxyz") = "xyz"
 StringUtils.difference("abcde", "xyz") = "xyz"

参照: https://commons.Apache.org/proper/commons-lang/javadocs/api-2.6/org/Apache/commons/lang/StringUtils.html

13
ccu

文字列を反復処理しないと、thatが異なることがわかります-where-ではなく、長さが異なる場合のみです。異なる文字が何であるかを本当に知る必要がある場合は、両方の文字列をタンデムで調べて、対応する場所の文字を比較する必要があります。

13
Kilian Foth

以下のJavaスニペットは、文字列を等しくするためにそれぞれの文字列から削除(または追加)する必要のある最小限の文字セットを効率的に計算します。動的プログラミングの例です。

import Java.util.HashMap;
import Java.util.Map;

public class StringUtils {

    /**
     * Examples
     */
    public static void main(String[] args) {
        System.out.println(diff("this is a example", "this is a examp")); // prints (le,)
        System.out.println(diff("Honda", "Hyundai")); // prints (o,yui)
        System.out.println(diff("Toyota", "Coyote")); // prints (Ta,Ce)
        System.out.println(diff("Flomax", "Volmax")); // prints (Fo,Vo)
    }

    /**
     * Returns a minimal set of characters that have to be removed from (or added to) the respective
     * strings to make the strings equal.
     */
    public static Pair<String> diff(String a, String b) {
        return diffHelper(a, b, new HashMap<>());
    }

    /**
     * Recursively compute a minimal set of characters while remembering already computed substrings.
     * Runs in O(n^2).
     */
    private static Pair<String> diffHelper(String a, String b, Map<Long, Pair<String>> lookup) {
        long key = ((long) a.length()) << 32 | b.length();
        if (!lookup.containsKey(key)) {
            Pair<String> value;
            if (a.isEmpty() || b.isEmpty()) {
                value = new Pair<>(a, b);
            } else if (a.charAt(0) == b.charAt(0)) {
                value = diffHelper(a.substring(1), b.substring(1), lookup);
            } else {
                Pair<String> aa = diffHelper(a.substring(1), b, lookup);
                Pair<String> bb = diffHelper(a, b.substring(1), lookup);
                if (aa.first.length() + aa.second.length() < bb.first.length() + bb.second.length()) {
                    value = new Pair<>(a.charAt(0) + aa.first, aa.second);
                } else {
                    value = new Pair<>(bb.first, b.charAt(0) + bb.second);
                }
            }
            lookup.put(key, value);
        }
        return lookup.get(key);
    }

    public static class Pair<T> {
        public Pair(T first, T second) {
            this.first = first;
            this.second = second;
        }

        public final T first, second;

        public String toString() {
            return "(" + first + "," + second + ")";
        }
    }
}
7
jjoller
String strDiffChop(String s1, String s2) {
    if (s1.length > s2.length) {
        return s1.substring(s2.length - 1);
    } else if (s2.length > s1.length) {
        return s2.substring(s1.length - 1);
    } else {
        return null;
    }
}
2
GlenPeterson

2行で異なる単語を見つけるには、次のコードを使用できます。

    String[] strList1 = str1.split(" ");
    String[] strList2 = str2.split(" ");

    List<String> list1 = Arrays.asList(strList1);
    List<String> list2 = Arrays.asList(strList2);

    // Prepare a union
    List<String> union = new ArrayList<>(list1);
    union.addAll(list2);

    // Prepare an intersection
    List<String> intersection = new ArrayList<>(list1);
    intersection.retainAll(list2);

    // Subtract the intersection from the union
    union.removeAll(intersection);

    for (String s : union) {
        System.out.println(s);
    }

最後に、両方のリストで異なる単語のリストがあります。簡単に変更して、異なる単語を最初のリストまたは2番目のリストに同時に持つことができます。これは、共用体の代わりにlist1またはlist2からのみ交差点を削除することで実行できます。

正確な位置の計算は、分割リスト内の各Wordの長さを(分割正規表現とともに)加算するか、単にString.indexOf( "subStr")を実行することで実行できます。

1
stolen_leaves

最後だけでなく、変更されたセクションのみを直接取得するには、Googleの Diff Match Patch を使用できます。

List<Diff> diffs = new DiffMatchPatch().diffMain("stringend", "stringdiffend");
  for (Diff diff : diffs) {
    if (diff.operation == Operation.INSERT) {
      return diff.text; // Return only single diff, can also find multiple based on use case
    }
  }
}

Androidに追加するには:implementation 'org.bitbucket.cowwoc:diff-match-patch:1.2'

このパッケージはこの機能よりもはるかに強力で、主にdiff関連のツールを作成するために使用されます。

0
Gibolt