web-dev-qa-db-ja.com

正規表現を使用してPDFを検索する方法

通常、私はNotepad ++を使用して、正規表現を使用してファイルを検索します。今日、PDFに対して同じことを行うPDFプログラムがあるかどうか疑問に思っています。もちろん、PDFをテキストに変換して、Notepad ++を使用することもできますが、あります。変換せずにもっと簡単な方法は?

15
Michael S.

いくつかのオプション:

9
akira
  1. Agent Ransackは無料(ライト)で、リリースノートで確認されているようにPDFをサポートしています。
  2. PowerGREPは商用製品です。

あなたが言ったように、明白な代替手段はPDFをテキストに変換することです。プログラマーが一括処理用に設定する1つの方法は、PythonパッケージPDFMiner。エージェントRansackはXpdfプロジェクトの "pdftotext"を使用することです(あなたもそうすることができます)。

4
minopret