web-dev-qa-db-ja.com

音声をテキストに変換するにはどうすればよいですか?

MP3を取得して、音声をテキストに変換するにはどうすればよいですか?

会議や会議から録音されたメモがいくつかあります(録音には単一の音声があり、これが私の音声です)。私は、単に手で書き写すのではなく、音声テキスト変換ツールを使用してテキストに変換する方が簡単で知的に面白いと思いました。特にアスタリスクとポッドキャストを使用するVoIPアプリケーション向けの技術があることは知っていますが、それらは何で、どのように使用できますか?

44

オープンソース: CMU Sphinx

シェアウェア: http://www.e-speaking.com/ (Windows)

コマーシャル: Dragon NaturallySpeaking (Windows)

30
Jeff Bauer

.NETは、System.Speech名前空間を使用してこれを実行できます。

最初に.wavに変換するか、マイクからライブでオーディオをキャプチャする必要があります。

実装の詳細については、こちらをご覧ください。 。NETでの音声の転写

5
bulltorious

Dragon NaturallySpeaking はMP3入力をサポートしているようです。

オープンソースバージョン が必要な場合(これに基づくAsterisk統合プロジェクトがあると思います)。

4
diciu

パーティーに遅れているので、将来の参考のためにもっと答えてください。

分野の進歩+ Mozillaの考え方とアジェンダは、その目的のためにこれらの2つのプロジェクトにつながりました。

後者には、ダウンロード用の12GBデータセットがあります。前者は、私の理解のためにあなた自身のオーディオファイルでモデルを訓練することを可能にします

3
Thalis K.