web-dev-qa-db-ja.com

コマンドラインから大きなPDFを翻訳する方法は?

大きなpdfファイル(83 MB)があり、それを翻訳したいと思います。 pdftkでファイルを分割し、各部分を https://www.onlinedoctranslator.com/en/ で翻訳しようとしました(ファイルは10 MBを超えることはできません)。それは非常に労働集約的です。推奨される翻訳者はGoogleエンジンです。このタスクを自動化する簡単な方法がない場合PDFを偶数サイズ(MB単位)の部分に分割する方法のヒントを教えていただければ助かります。

3
Przemek

Translate-Shellをご覧ください

これにより、transというコマンドがインストールされ、翻訳するように指示できます。プロジェクトページの例。

Translate Shell(以前のGoogle Translate CLI)は、Google Translate(デフォルト)、Bing Translator、Yandex.Translate、およびApertiumを搭載したコマンドライントランスレーターです。ターミナルでこれらの翻訳エンジンの1つに簡単にアクセスできます。

$ trans 'Saluton, Mondo!'
Saluton, Mondo!

Hello, World!

Translations of Saluton, Mondo!
[ Esperanto -> English ]
Saluton ,
    Hello,
Mondo !
    World!

デフォルトでは、詳細な説明を含む翻訳が表示されます。テキストを簡単に翻訳することもできます:(最も関連性の高い翻訳のみが表示されます)

$ trans -brief 'Saluton, Mondo!'
Hello, World!

言語を使用するように指示することもできます。

trans :fr Word

そしてさらにあります:

trans -browser firefox :fr http://www.w3.org/

www.w3.orgのフランス語翻訳でFirefoxを開きます。

PDFを直接翻訳する方法はありません。ファイルの方法:

trans :fr file://input.txt

ここでPDFに関連して:

Sudo apt install poppler-utils

そのツールを使用すると、PDFからテキストファイルを作成できます。

pdftotext your.pdf your.txt
  • 追加 -layoutレイアウトを保持する
  • 追加 -opw {password}パスワードがある場合

ファイルをフィードできます

trans file://your.txt

次のステップ:PDFに戻る

Sudo apt-get install enscript ghostscript

そしてポストスクリプトに変換してからPDFに変換します:

enscript -p output.ps your.txt
ps2pdf output.ps your2.pdf

私はこれをPDFにいくつかの単語を含めて)動作させました。大きなファイルで動作することを保証するものではないので、動作した場合は以下にコメントしてください。

3
Rinzwind