web-dev-qa-db-ja.com

2つのODTドキュメントの類似性および/または相違点(Linux)

2つのODTドキュメントがあり、内容が非常に近いので、それらを比較して、どれほど類似しているかを確認したいと思います。

最善の方法は、類似度を使用することです。不可能な場合は、少なくとも何らかの差分を使用することもできます。

私はUbuntu Lucidを実行しています。


解決策:

odt2txtを使用してファイルをテキストに変換し、次にwdiff -i --statistics one.txt two.txtを使用して、一般的な単語の割合(類似性)を示す統計とともに差分を作成しました。

15
Weboide

私はそれらを自分で試したことはありませんが このツールのペア -odt2txtとoodiff--は有望に見えます。

8
JRobert

組み込みの比較機能を試しましたか? ドキュメントの編集/比較...

テキストの差分が必要な場合は、両方のドキュメントをプレーンテキストに変換してから、通常の差分を実行するのが最善の策です。ただし、改行を正規化する方法を理解する必要があります。そうしないと、差分はあまり役に立ちません。

21
sleske

テキストのフォーマットを気にしない場合は、コンテンツをプレーンテキストファイルにコピーして、古き良き差分を使用することもできます。

ps:あなたは可能な詐欺師を探している教師ですか? :p

1
tamtakos

私がこれを行う方法は、libreofficeで.pdfファイルを作成し、diffpdfを使用して2つのpdfファイルを比較することです。これは、並列ウィンドウで強調表示された違いを示しています

1
Peter Allott