web-dev-qa-db-ja.com

Windows用の優れたテキスト読み上げソリューション

私はWindows7を実行していて、アプリケーションでテキストを読み取る機能があることを知っていますが、テキストのチャンクをwavファイルまたはmp3として保存するための優れたユーティリティを探しています。すでにOSに組み込まれている可能性がありますが、巧妙に偽装されています。 プログラムを書く APIを呼び出すことができることはわかっています。これは、適切な解決策がまだない場合の次のステップです。

AT&Tシステム の品質は本当に気に入っていますが、作成されたMP3の使用にはかなり厳しい制限があります。ポッドキャストで使用したいのですが。

Webベースでも、かなり邪魔にならない(パブリックドメインまたはクリエイティブコモンズ)Wav、MP3、またはその他の標準オーディオファイルを簡単に作成できる限り問題ありません。当然、私は商用よりも無料またはオープンソースを好みますが、それは必須ではありません。

9
Jim McKeeth

espeakfestivalMaryTTS を試しました。それらはすべてほとんどの部分で理解できる声を生成しますが、それらはあまり自然ではありません。これらのシステム(Mbrola、CMU Arcticなど)に追加の音声ダウンロードを行っても、音声はそれほど大きくありません。

[〜#〜] ivona [〜#〜] 声は私が今まで聞いた中で最高です。 30日間の無料デモが提供されます。これは、1回限りのタスクを実行する場合に十分です。その後、彼らは45ドル/声のようです。アマゾンは会社を買収したばかりなので、堅実であることがわかります( http://www.ivona.com/us/news/amazoncom-announces-acquisition-of-ivona-software/ )。

これらはMicrosoftのSAPIインターフェイスで動作します。つまり、音声はそれをサポートするすべてのプログラム(Adobe Readerなど)で利用できます。私はそれらを Text To Wav プログラムで使用してきました。これはテキストファイルをWaveファイルに一括変換するのに最適です。

編集

実際には、質問を読み直してください。個人的な使用以外(ポッドキャストなど)の場合、IVONAの価格はおそらくはるかに高いと思います。その場合は、MaryTTSをチェックしてください。

4
User

eSpeak は無料でオープンソースであり、必要なものすべてを提供します。

ファイルまたはstdinからテキストを読み上げるコマンドラインプログラムとして実行できます。
共有ライブラリバージョンも利用できます。
 
 *さまざまな音声が含まれています、その特性を変更できます。
 * WAVファイルとして音声出力を生成できます。
 * SSML(音声合成マークアップ言語)がサポートされています(完全ではありません)、
およびHTMLもサポートされています。
* コンパクトサイズ。プログラムとそのデータ(多くの言語を含む)
の合計は約1Mバイトです。
 *テキストを音素コードに翻訳できるため、別の音声のフロントエンド
として使用できます。合成エンジン。
 *他の言語の可能性。いくつかは進行のさまざまな段階
に含まれています。これらまたは他の言語のネイティブスピーカーからの支援を歓迎します。
 *音素データの生成と調整に使用できる開発ツール。
 * C++で記述されています。
6
John T