web-dev-qa-db-ja.com

合理的な自動HTMLからPDFへの変換(UNIX / Linux環境))

LinuxでPDFドキュメントをHTMLファイルから自動的に生成する方法はありますか?PDFは、入力ファイルにある程度の妥当なレベルの類似性を提供しますか?

ある種の対話型GUIとは対照的に、コマンドラインツールが重要です。

もちろん、htmldocといくつかの関連する従兄弟を試しました。しかし、これらのツールは絶望的な石器時代です。 htmldocはCSSをまったくサポートしていません。最近、少なくともsome CSSスタイルが設定されていない多くのHTMLドキュメントは見つかりません。私は本当にばかげた効果や小さな装飾については気にしませんが、問題はCSSが最近のほとんどのレイアウトの中心にあるということです。ネストされたテーブルの6層を使用している人は多くありません。したがって、変換ツールがCSSをまったく理解していない場合、それは単に「ドキュメントが正しく表示されない」という問題ではありません。ユーザビリティの最低基準をまったく満たしていない可能性があります。

Geckoレンダリングエンジンを使用してPDFに変換できる画像を生成することをお勧めする方もいらっしゃると思いますが、簡単に言うまでもなく、これをどのように行うのかわかりません。

これを行う優れた商用ツールがあるとは信じても問題ありませんが、可能な限りオープンソースのパッケージを探しています。これは、努力自体がオープンソースのパッケージであり、費用がかからないためです。

前もって感謝します!

16
Alex Balashov

wkhtmltopdf を見たことはありますか?それが個人的にどれほどうまく機能するか言うことはできませんが、それはまさにあなたが必要としているもののようです。これと「ブラウザの自動化」ソリューションでは、画面表示ではなく印刷スタイルシートを取得するため、PDFが画面に表示されるものとは異なる場合があります。 。

7
robertc

Python-beautifulsoupでchm2pdfを試してください。

2
riza

XHTML2PDF は、PythonコマンドラインスクリプトとPythonライブラリの両方を含むツールセットです(これを何かに埋め込む必要がある場合)スクリプトにシェルアウトせずに大きくします。)フォーマットされた出力を微調整するためのベンダー固有のCSSスタイル(ページ番号、段落フローなど)を備えたHTML/XHTMLおよびCSSをサポートします。

私はこれをほんの少し使用して、いくつかのHTMLドキュメントをバッチ処理しただけですが、うまく機能し、その機能セットは私には包括的であるようです。マニュアルはデモページに隠されていますが、それ自体がHTMLドキュメントからPDFへの変換の良い例です。

「前」と「後」の例へのリンクの素敵なセットがありましたが、私は自分のアカウントを作成しました、そして明らかに、スパマーだけが最初の投稿に複数のリンクを入れました:-p

2
Tripp Lilley

コマンドラインからHTMLページからいくつかのPNGを生成したいと思いました。どこかで見つけた this Ruby script mozembedを使用してスクリーンショットを生成します。拡大縮小したくない場合は、拡大縮小線を削除できます。

唯一の問題は、ページが実際に画面に表示されることです...

1
chmeee

dompdfを試してみてください。コマンドラインからは正常に動作し、その例ではあらゆる種類のhtmlで動作します

0
Daniel Provin

PrinceXML。 CSSを問題なく処理できます。 Linux、Windows、Mac OS Xのバージョンが利用可能です。 AFAICS、これはGoogleドキュメントのPDF出力の背後にあるテクノロジーでもあります。ただし、これはペイウェアです。

0
Kurt Pfeifle