web-dev-qa-db-ja.com

HTML EメールをFetchMailでプレーンテキストに変換するにはどうすればよいですか。

私は最近、私たちのバグトラッカーのための電子メールゲートウェイを設定しました。これはもともと私たちのサーバーソフトウェアからの合理化エラー報告の方法として意図されていました。私はそれについて私の同僚に言った、そして彼らはこの機能を持っていても嬉しかったですが、私はEntourage/Outlookの電子メールによって与えられた私の貧しいシステムの虐待を発見するために恐ろされました。

まず、 'name =?ISO-8859-1?b?tgp1bmdddhl2bq == ?? = "'のように、送信者のEメールアドレスは恐ろしく閉じ込められています。電子メールの本文はHTML添付ファイルです。もちろん不要な量の追加コードがあります。 。添付ファイルは、バグトラッカーのチケットの添付ファイルとして表示され、チケットの本文が空であるため、特に厄介です。

私は少しのグーグルをしましたが、解決策を提案したのは解決策のみが提案されています 巨大な醜いawkまたはperl scripts

ここでより良い解決策は何ですか?

私たちのターゲットプラットフォームはWindowsサーバーです、そして私はPythonで何かを好むでしょうが、私たちはCygwinのインストールを持っていて、必要に応じて他のUNIXユーティリティを使用することができます。

3
Nik Reiman

fetchmailは、その名前が言うように、メールをフェッチするためのみです。

UNIXシステムでは、ほとんどの人は電子メール処理にprocmailを使用します。 /<html/iをチェックし、w3m -dump(またはlynx -dumpまたは必要なもの)を介してメッセージをパイプするレシピを作成できます。私はwindowsのために同様のことが存在するかどうかわからない...

(HTMLをオフにするためのチュートリアルでprocmailも_ [$ var]を作るのです。)

3
grawity