web-dev-qa-db-ja.com

HTMLをepubにプログラムで変換する方法は?

プログラミング言語またはライブラリでこの変換を行うことはできますか?

39
Juanjo Conti

簡単な答えはイエスです。どのプログラミング言語でも実行できます。

基本的な手順:

  1. HTMLをXHTML(+ CSS)に変換します。これは、プログラムまたはXSLTファイルを使用して実行できます。
  2. ファイル(XHTML、CSS、画像およびフォント)をフォーマットに従ったディレクトリ構造にコピーします。
  3. ディレクトリ構造を圧縮して、アーカイブに「.epub」拡張子を付けて名前を付けます。

始めるのに役立ついくつかのWebサイト:

2015年6月注:epubcheckバリデーターは、GoogleコードからGitHubに移動しました。新しいURLに注意してください。

55
eb1

Calibre は、HTMLを含むさまざまな入力形式、およびEPUBを含むさまざまな出力形式をサポートしますが、「プログラミング言語またはライブラリ」ではありません。自立型のツールではなく、プログラミングベースのアプローチを望む特定の理由はありますか?もしそうなら、多分Python and ebookmaker.py は、あなたを助けるかもしれません。

15
Alex Martelli

返信が遅くなりましたが、少なくともUTF-8 BOMを削除するプルリクエストを投稿した後、Python 3-based ebookmaker が価値があることを発見しました。問題の1つは、 HTMLを解析するための脆弱な正規表現 を使用しているように見えますが、そこで報告する必要があると思います。

3
Shlomi Fish

Asposeの次のライブラリを使用しています- http://www.aspose.com/categories/.net-components/aspose.words-for-.net/default.aspx

わずか2行のコードで、htmlからepubへの変換を行うことができます。現在、運用システムでこれを使用しています。

ドキュメントdoc = new Document(_sourceFilePath);

doc.Save(_destinationFilePath、SaveFormat.Epub);

1
Brian Singh

Java(OpenJDK compatible): html2epub でこのようなツールを実装し始めたところです。設定ファイルを手動で編集する手間を省くために、おそらく任意のディレクトリから設定ファイルを生成するための別のツール(ただし、EPUB内のXHTMLの順序を決定する必要があります。非プログラム使用の場合、GUIヘルパーツールの開発を検討できます。プログラムによる解決策、まだアイデアを思いつきませんでした。その前に、カスタムXML入力用のシェルスクリプトベースのコンバーターを実装しました( hag2epub tools )-興味がある場合は、おそらくそれらをXHTML入力に移植します(EPUBメタデータの構成ファイルを使用するか、存在する場合はディレクトリの最上位のindex.htmlからメタデータを取得します)。

1
skreutzer

ここに pdf to epub がありますが、それはあなたが望んでいるものではないことを知っていますが、それは始まりです。

calibre パッケージには、必要なものが含まれている場合があります

1
cofiem

IPadで一部のWebページコンテンツをオフラインで読みたいため、以前にも同じ問題があります。私にはわからないし、コンピューターに精通していない。口径またはスタンザblablaがあります。

しかし、私にとっては、それらは単なるフォーマットコンバーターであり、ePubブッククリエーターが必要です。それから私は本っぽい htmlからePubへのコンバーター を見つけました。ウェブからhtmlページを保存し、それで変換します。今では私にとって非常に良いツールです。

0
user81718