web-dev-qa-db-ja.com

PDFからHTMLへの変換

PDFファイルを入力として使用し、HTMLファイルを出力として使用する.dllはありますか?PDFからHTMLに変換したいです。 PDFからtext/font/image/margins/linksなどを取得し、同じ内容の新しいHTMLファイルを作成することは非常に難しいと同僚は言っています。だから私は考えていました-それを行うための参照として使用できるdllがある場合は?

23
petko_stankoski

それを行うためのプログラムを書くことは決して簡単ではありません。これを行う.NETライブラリが見つからない場合(少なくとも、無料ではありませんでした)、 これをダウンロードし プログラムで呼び出して、htmlを取得します。

時間があり、PDFToHtmlが許容できる出力を生成しない場合は、 iText を使用してプログラムを自分で作成できます。それは非常に成熟した無料のPDFライブラリです。私は過去にPDFの操作(マージ、作成など)に使用しました。

[〜#〜]更新[〜#〜]

Quandaryのコメントにあるように、 PDFSharp ライブラリは、iTextが提供する商用またはAGPLライセンスと比較して、よりリラックスしたライセンス(MIT)を提供します。ライブラリを選択するときは、このことに注意してください。私はPDFSharpライブラリを自分で使用したことがなく、機能の点でどのように比較するのかわかりません。

11
Icarus

この無料ツールをダウンロードできます: PDFToHTML

次に、プログラムで新しいプロセスをforkし、PDFファイルを渡して実行可能ファイルを実行します。今テストしたところ、問題なく動作しているようです。

8
Tudor

支払いを気にしない場合、Asposeは非常に優れたソリューションを提供します。これが私たちの会社で使用しているものです。

http://www.aspose.com/categories/.net-components/aspose.pdf-for-.net/key-features.aspx

6
Calum