web-dev-qa-db-ja.com

テキスト検索をプログラムしてPDFファイルに置き換える方法

多数のPDFファイルのテキストをプログラムで検索して置き換えるにはどうすればよいですか?一連のファイルに追加されたURLを削除したいのですが。 Adobe Proのバッチ処理でjavascriptを使用してリンクを削除しますが、リンクテキストは残ります。手動で機能するテキストタッチアップを使用することをお勧めしますが、1300ファイルを手動で変更したくありません。

17
rpilkey

PDFでテキストを見つけることは、ドキュメント形式のグラフィカルな性質のために本質的に難しい場合があります-検索している文字がファイル内で連続していない可能性があります。つまり、 CAM :: PDF にはいくつかの検索置換機能とヒューリスティックがあります。 changepagestring.pl を試してみて、 PDF。

15
Chris Dolan

私も必死になっています。 10後PDFエディターのインストールはすべて費用がかかり、成功しませんでした:

pdftk +エディターで十分です:

テキストをPDFファイルに置き換えます

  • Pdftkを使用してPDFページストリームを解凍します

    pdftkoriginal.pdf出力original.clear.pdf解凍

  • テキストを置き換えます(これが機能する場合と機能しない場合があります)。

  • 変更された(そして現在壊れている)PDFを修復する

    pdftkoriginal.clear.pdf出力original.clear.fixed.pdf

(ジョエルデアから)

6
Larry

あなたのためにそれを行うことができるプログラムがあるとき、私があなたの1300ファイルを修正するためのコードを書くためにすべての仕事をしたいと思うかどうかはわかりません。先日、ProfessionalバージョンのInfixを使用して、「ファイル内の検索と置換」機能を使用して、ほぼ100個のファイルをバッチ変更しました。それは素晴らしい働きをします。 Microsoft Wordに似た機能の検索と置換を見つけることを期待して、他のプログラムを評価しました。それができるのはInfixだけでした。チェックアウト: http://www.iceni.com/infix-pro.htm

2
stirhale

Adobe Acrobat Proの「編集」機能を使用して、1つのステップで単一のドキュメント内のすべての参照を検索および置換できます...複数のステップに自動化できるかどうかはわかりません。

http://help.Adobe.com/en_US/Acrobat/9.0/Professional/WS5E28D332-9FF7-4569-AFAD-79AD60092D4D.w.html

2
davr

これは解決策の半分にすぎませんが、タッチアップとAppleScriptのサポートを組み合わせてキーストロークを送信し、数千のテーブルセルの文字列を置き換えました。あなたのページがどのようにレイアウトされているかに応じて、それはあなたのために働くかもしれません。私の場合、すべてのテーブルの先頭にカーソルを手動で挿入する必要がありました(数十のテーブル-手動プロセスでは非常に管理しやすい)が、その後、数千のセルを自動的に置き換えました。

1
d-b

二重発音区別符号と合成発音区別符号の文字が交互発音区別符号に置き換えられる別のテキストを生成することを期待して、発音区別符号が追加されたテキストで構成されるテキストのインフィックスを試し終えたところです。 Infixは、プログラマティックソリューションの動作を理解する手間を気にしない人にとっては間違いなく良いソリューションです。すべてのリクエストの変更が有効になりました。テキストのレイアウトを変更する単語のリフローを実行する方法を理解する必要があります。

1
sobusola

質問はプログラムによる解決策ですが、この無料のオンラインツールを共有することで、いくつかのPDFファイル:

http://www.pdfdu.com/pdf-replace-text.aspx

テキストを置き換えた後、結果のPDFファイルに広告やその他の変更があったことに気づきませんでした。

試したソフトウェアでローカルに変更を加えることができませんでした。主な問題は、PDFで使用されているフォントが欠落していて、Acrobat Proでも正しく機能しなかったことです。オンラインツールは文句を言わず、素晴らしい結果を生み出しました。

1
Dimitar

VeryPDF PDFテキスト置換コマンドラインソフトウェアを使用してPDFページのテキストをバッチ置換することをお勧めします。pdftr.exeを実行してPDFページのテキストを置換できます。簡単に、例えば、

pdftr.exe -contentreplace "My Name => Your Name" D:\ in.pdf D:\ out.pdf

pdftr.exe -searchandoverlaytext "My Name => Your Name" D:\ in.pdf D:\ out.pdf

pdftr.exe -searchandoverlaytext "My Name => D:\ temp\myname.png * 20 * 20" D:\ in.pdf D:\ out.pdf

pdftr.exe -pagerange 1-3 -contentreplace "古いテキスト=>新しいテキスト|| VeryPDF => VeryDOC ||私の名前=>あなたの名前" D:\ in.pdf D:\ out.pdf

pdftr.exe -searchtext "string" C:\ in.pdf

pdftr.exe -pagerange 1 -searchtext "string" C:\ in.pdf

pdftr.exe -pagerange 1 -searchandoverlaytext "古いテキスト=>新しいテキスト|| VeryPDF => VeryDOC ||私の名前=>あなたの名前" D:\ in.pdf D:\ out.pdf

pdftr.exe -overlaytextfontname "Arial" -overlaytextcolor FF0000 -overlaybgcolor 00FF00 -searchandoverlaytext "古いテキスト=>新しいテキスト|| VeryPDF => VeryDOC ||私の名前=>あなたの名前" D:\ in.pdf D:\ out.pdf

pdftr.exe -opw 123 -upw 456 -contentreplace "古いテキスト=>新しいテキスト|| VeryPDF => VeryDOC ||私の名前=>あなたの名前" D:\ in.pdf D:\ out.pdf

pdftr.exe -searchandoverlaytext "PDFcamp Printer => VeryPDF Printer" -overlaytextfontsize 8 D:\ in.pdf D:\ out.pdf

pdftr.exe -searchandoverlaytext "PDFcamp Printer => VeryPDF Printer" -overlaytextfontsize 80%D:\ in.pdf D:\ out.pdf

0
smith