web-dev-qa-db-ja.com

LinuxコマンドラインでHTML / PDFからDOC(X)へ?

PDFまたはHTML + CSSをDOCまたはLinuxではDOCXに変換する必要があります。これは、コマンドラインまたはスクリプト言語から行うことができます。

何か案が?

4
alcuadrado

コマンドラインからOpenOfficeを使用して後者を実行できる場合があります。スクリプト言語の架け橋もあります。詳細については、OpenOfficeのWebサイトを参照してください。 PHP call [〜#〜] puno [〜#〜] )用のものがありますが、私はまだ個人的な経験がありません。

1
Pekka

OpenOfficeマクロを使用してHTMLを.docに変換できます。次のスレッドを参照してください。

http://www.oooforum.org/forum/viewtopic.phtml?p=44367#44367

PDF-スキャンされたテキストなどにPDFが使用されることが非常に多いため、pdfを.docに変換するのははるかに困難です。

1
Colin Pickard

pdftohtml を使用して、PDFからHTMLファイルを作成できます。

Wordはhtmlファイルを直接開くことができます。

1
voyager

私はちょうどこの質問に出くわしました、そしてもう少しグーグルした後、pandocを見つけました: http://johnmacfarlane.net/pandoc/README.html

簡単なコマンドは、次のようにhtml入力からdocxまたはpdf(またはrtfなど)ファイルを作成します。

pandoc -o output.docx input.html

また、stdout(一部の形式)に書き込んだり、stdinから読み取ったりすることもできます。

それがdebian/ubuntuリポジトリにあるかどうかはわかりませんが、Redhat/CentOS6のepel6リポジトリにあります(yum install pandoc)。

これが誰かに役立つことを願っています:)

1
jammypeach