web-dev-qa-db-ja.com

Microsoft Wordドキュメント(.doc / x)をHTMLファイルに変換する

誰もが迅速かつ効率的にそれを達成するための良いアプリケーションを知っていますか?

Word Cleaner を購入しましたが、結果は十分であり、生成されたすべてのhtmlファイルを調べて、次のような無駄な挿入タグを大量に削除する必要があります

<strong>H</strong><strong>ell</strong><strong>o </strong><em>Wor</em><em>ld</em>

私が管理するWebサイトに表示される記事のほとんどは、人々がMS Wordで書いた文書に基づいています。MSWordの余白や順序付き/順序なしリスト、脚注/末尾のメモなどについてはほとんどわかりません。

CSSスタイルを修正して適用するよりも、それらのページを効率的に処理するのに役立つヒントはありますか?

注:記録のために、Wordで「HTML DOCとして保存」を使用することは、Wordクリーナーよりも最悪です。

7
danie7LT

これは私と職場のチームがMS WordコンテンツをHTMLに取り込む際に使用するものです。

http://Word2cleanhtml.com/

すべてのボックスをチェックし、コードを貼り付けてから変換します。

それがお役に立てば幸いです。

4
KruegerDesigns

これに対する最善の解決策は、WYSIWYGエディターを使用することだと思います。たとえば、TinyMCEは良いものです-スタンドアロンのものが必要かもしれませんが。使い方はWordライクなプログラムと似ていますが、出力はHTMLのままです。また、OpenOfficeやLibreOfficeなどの他のWordライクなプログラムを試しましたか? HTMLはインラインスタイリングが多いのであまり良くありませんが、簡単なテストからは不要なタグがたくさんあるという問題はないようです。

3
milo5b