web-dev-qa-db-ja.com

PDFが変更されたかどうかを確認する方法

サードパーティシステムによって生成されたPDFがあります。PDFエディターまたはelsソフトウェアを使用して、変更しました。
元のファイルなしでPDFファイルが変更されたかどうかを検出することは可能ですか?

詳細を追加します。

暗号化や署名機能はありません。

ドキュメントはITシステムによって作成されます。ユーザーはドキュメントを受け取り、それを変更します。

どういうわけかその変化を追跡することは可能ですか?

これらのアプリケーションはすべて、PDFヘッダーまたはファイル内のどこかにエンコードされた場所にデータを残し、それを確認できると思いました。しかし、Windowsエクスプローラーによって表示されるプロパティには何も表示されません...エクスプローラーでプロパティ/ヘッダーを表示するよりも賢い方法があります。

9
stan

これに伴う問題は、プレビューでMacでPDFを開き、Command-Sを押してファイルを保存するだけで、作成日と変更日の両方が現在の日付/時刻に一致するように置き換えられることです。作成日も間違っています。初心者のユーザーでも無意識のうちにこれを行う可能性があるため、意図的にドキュメントを変更している可能性のある人を追跡しようとすると、誤検知につながる可能性があります。

残念ながら、あなたが求めていることは、なりすましやだましが簡単すぎます。

2
Ethan Allen

PDFファイルのmd5sumはいつでも確認できます。使用している環境がわかりませんが、それはあなたが始めるのに役立つはずです。

2
Bartek

ユーザーはAcrobatを使用してPDFを変更していますか?その場合、上記のDanioが機能するはずです。厳密に言えば、PDFを変更すると、ModDateまたはxmpが変更されます。 CreationDateを変更せずにModifyDate。ただし、すべてのツールがこれに準拠しているわけではありません。かなりの数のツールがすべてのメタデータをそのままにしておくため、このチェック方法は、PDFエディターのユーザーが採用しています。

ユーザーが使用するエディターがModDateまたはxmp:ModifyDateを変更する場合は、2か所で確認できるはずです。 1つは、Acrobatでドキュメントを開き、Ctrl-Dを押してドキュメントのプロパティを表示する場合です。 [作成]フィールドと[変更]フィールドのタイムスタンプは異なる必要があります。このメタデータをプログラムで取得するために使用できるAPIもあります。視覚化できるもう1つの方法は、メモ帳でPDFを開いてプロパティを検索することです。ほとんどのドキュメントは人間が読める形式ではありませんが、これらのタイムスタンプは判読できるはずです。適切に変更すれば、アプリケーションでいつでも解析できます。頑張ってください。

buntu linux 18.04 を使用していて、 Document Viewer を使用している場合は、次のことができます。

  • ファイルオプション(3つの縦線の省略記号)をクリックします
  • プロパティをクリックします...
  • プロパティポップアップでCreated/Modifiedフィールドを探します

注意:十分な知識のあるユーザーは、CreatedおよびModifiedを変更せずに、PDFコンテンツを操作できます。 PDFメタデータとファイルシステムのタイムスタンプ。

1
student

暗号化やデジタル署名などのセキュリティ機能が適用されていない限り、元のファイルがないと大雑把になりますが、そうではないようです。元のファイルに関する情報にアクセスできますか?ファイルサイズ、作成日、メタデータなどはありますか?

PDFを変更するために使用されるツールがPDF仕様に従って機能している場合、情報ディクショナリではModDateを更新する必要がありますが、CreationDateはそのままにしておく必要があります。すべてのオブジェクトが再生成されたため、世代0になる可能性はありますが、オブジェクトにゼロ以外の世代番号がいくつか表示されます。 CosEdit の試用版では、これら2つを確認できます。アイテム。

ただし、ツールを使用してPDFをトレースを残さずに意図的に変更した場合、それらはデータのそれらのビットをスプーフィングするため、役に立ちません。

1
danio

いくつかのツールを使用して、pdfファイルのプロパティを取得できます。

私はpdfinfoを使用していますが、ファイルの多くのプロパティを取得して確認できます。

pdfinfo 58dcc41d01293.pdf
    Author:         worker
    Creator:        Microsoft® Word 2016
    Producer:       Microsoft® Word 2016
    CreationDate:   Sat Aug 24 16:02:29 2019
    ModDate:        Sat Aug 24 16:02:29 2019
    Tagged:         yes
    UserProperties: no
    Suspects:       no
    Form:           none
    JavaScript:     no
    Pages:          55
    Encrypted:      no
    Page size:      841.92 x 595.32 pts (A4)
    Page rot:       0
    File size:      3346838 bytes
    Optimized:      no
    PDF version:    1.7
0
Kris Roofe