web-dev-qa-db-ja.com

PDF to HTML-バッチコンバーター-最も信頼性が高く正確な無料でソフトウェアの有料ですか?

無料または有料(約50 $/40ポンド)[〜#〜]バッチ[〜#〜]PDFをHTMLに変換して、複数PDFファイルを一度に変換します。

ファイル内のベクトル化された画像とビットマップ画像を処理できる必要があり、両方をhtmlページで参照されるjpegとして出力します。

Iorigsoft有料PDFをHTMLに試してみました-ハングしたりアイドル状態になったりする問題があり、実際に変換されるもののリンクが壊れています-構成要素の章にhtmlとして間違った名前が使用されています。

また、intrapdf.comからのアプリケーションを試しましたが、これは変換の開始近くで一貫してクラッシュします。

更新:

intrapdfは、Windows XPマシンでは機能しますが、Windows7マシンでは機能しません。唯一の不具合は、フレーム化されたインデックスコンテンツhtml(ページ内のグラフィックがフレーム内のページに表示されない)にありますが、新しいタブでのみフレームを開くと、それらを表示できます。これは、chromeのみのブラウザの不具合である可能性があります。

この解決策は私にとっては十分です-私はすでにお金を使っています(私が尋ねる前に使っていました)が、これはWindows 7では機能しないため、自分の答えを受け入れることができません。

オープンソースツールを調べましたが、同じように不安定に見えるか、古いPDFバージョンを使用しています。

Windows 732ビットホームで必要です。

考え?

3
therobyouknow

私の解決策は、2つの部分1)IntraPDF PDF to JPGプログラムを引き続き使用することです(私はそれを支払いました)( http://www.intrapdf.com/ XPプラットフォーム上のconvert_pdf_to_html.htm )(Windows 7 Home 32ビットでは動作しないようです。ハングします)。

しかし、@ geekosaurは、PDFとHTMLの目標が異なるため、翻訳/変換が正確ではなく(おそらく、CSSがHTMLに適用されている場合でも)、実際には結果のHTML Iいくつかのページで見たように、同じではないフォーマットがありますが、それは可能です。

したがって、ソリューションの2番目の部分は、無料のアプリケーションプログラムツールIrfanViewを使用してPDFからJPGに変換することです。PDFドキュメントは、ドキュメントページごとに1つずつ、一連​​のJPG画像です。 。これはセットアップが簡単で、IrfanViewビューはプラグインスイートの一部としてPDF変換をパッケージ化し、PDFの前提条件は、IrfanViewがリンクを提供するGhostViewをダウンロードすることです。これは非常にうまく機能しますが、プロセス中にUIがハングすることがありますが、変換は続行されます。

http://en.irfanview-forum.de/vb/showthread.php?7689-Irfanview-freezes-during-PDF-to-JPG-conversion-if-you-try-to -continue-with-other-prog

私の目標を明確にするために、私は、将来ドキュメントを表示するためのより多くの可能性を私に与えるであろう非独占的なフォーマットのpdfドキュメントが欲しかった。 PDFはかなりユビキタスですが、フォーマットに縛られていないので、データが無料であることが好きです。

他の貢献者に感謝します:

0
therobyouknow

PDFはお粗末な変換用の入力形式であるため、「フレーク」はほとんどルールではありません。一部のファイルは比較的簡単に変換できますが、ほとんどのwillに問題があります。 (非常に簡単に:a PDFファイルは「ここに移動、これを出力、そこに移動、...」の圧縮リストです。ドキュメントに何か以外が含まれている場合単純なLからRへのテキスト(表、画像、RTLテキスト、脚注など)を変換すると、おそらくある程度のゴミが発生します。)

5
geekosaur

Canvas要素を使用するPDF.jsと呼ばれるHTMLJavascriptベースのPDFレンダラーがあります。 http://mozilla.github.com/pdf.js/web/viewer.html

それは開発中ですが、それはいくつかのために仕事をするかもしれません。

3
Luke Stanley

Openoffice/libreofficeに変換用のコマンドラインフラグがあるかどうかを確認します。

PDFは、あなたがやろうとしていることを嫌います。 PDFページの表示方法とHTMLのページの表示方法の間には、ドキュメントモデルの大きな不一致があります。変換できないファイルがPDF何でも簡単にHTMLに。

2
Rich Homolka

Iceniバッチの「Gemini」はPDFドキュメントをHTMLに変換します...

http://www.iceni.com/gemini-features.htm

出力は100%完全ではありませんが、許容できる場合があります。そして、それは仕事をするのに良い拠点です。あなたが完璧主義者なら、ポストプロダクションの「検索と置換」は通常、ほとんどの問題を解決することができます。

2
AffineMesh

試すことができます Okdo PDF to HTML Converter

1
Sathyajith Bhat

無料のオープンソースコマンドラインツールがあります http://sourceforge.net/projects/pdftohtml/

簡単な評価の結果、現在、主に単純なドキュメントに適しているようです。複雑なフォーマットは異なる場合があります。

ラテン語以外のエンコーディングでは動作が悪くなります。

0
Vadzim

もあります FREE PDF to HTMLツールによる http://www.freepdfsolutions.com

バッチサポート付きのシンプルなGUIを備えています。広告なし。

非常に単純な防弾トリックで同じフォーマットを維持するのに苦労しています。すべてのグラフィックは、すべてのページに単一の大きな背景jpg画像にレンダリングされます。また、htmlのすべてのテキストdivは絶対配置を使用します。これにより、正確に見える結果が得られますが、サイズが大きく、HTMLが醜いです。

0
Vadzim