web-dev-qa-db-ja.com

Text-to-Speech(音声生成)およびSpeech-to-Text(音声認識)API?

デスクトップまたはブラウザ環境用の既知のAPIの包括的なリストはありますか?

15

CまたはJavaまたはPHP? での音声認識)からの回答を再ハッシュして更新します。これは決して包括的なものではありませんが、あなたにとっては出発点かもしれません。


これらの質問を数か月間見てから、ほとんどの開発者の選択肢が次のように分類されるのを見てきました。

Windowsの人々-.NetまたはMicrosoft.SpeechのSystem.Speech機能を使用して、Microsoftが提供する無料の認識機能をインストールします。 Windows 7には、完全な音声エンジンが含まれています。その他は無料でダウンロードできます。 SAPIと呼ばれる同じエンジンへのC++ APIがあります。 http://msdn.Microsoft.com/en-us/magazine/cc163663.aspx を参照してください。または http://msdn.Microsoft.com/en-us/library/ms723627(v = vs.85).aspx 。 Windows用のMicrosoftエンジンに関するその他の背景 System.Speech.RecognitionとMicrosoft.Speech.Recognitionの違いは何ですか?

Linuxの人々-Sphinxには良い支持者がいるようだ。 http://cmusphinx.sourceforge.net/ および http://cmusphinx.sourceforge.net/wiki/ を参照してください。

商用製品- ニュアンスロケンドAT&T[〜#〜] ibm [〜#〜] 、その他。それぞれが、さまざまな言語用の独自のSDKとライブラリを提供します。

オンラインサービス- NuanceYapmeispeech.orgvlingo 、その他。 Nuanceは開発者プログラムを改善し、開発のために サービスへの無料アクセス を提供します。 Yap(私は信じています)は最近 Amazonが購入 だったので、そこでいくつかの変更が見られるかもしれません。

もちろん、これも役立つかもしれません http://en.wikipedia.org/wiki/List_of_speech_recognition_software

Java音声APIがあります。Java音声API http://Java.Sun.com/)のjavax.speech.recognitionを参照してください。 products/Java-media/Speech/forDevelopers/jsapi-guide/Recognition.html 。このAPIをサポートする音声エンジンを見つける必要があると思います。Sphinxが完全にサポートしているとは思いません--- http://cmusphinx.sourceforge.net/sphinx4/doc/Sphinx4-faq.html#support_jsapi

他にもたくさんのSO quesitons: Linux用の音声合成ツールと音声認識ツールが必要pyspeech(python)-mp3ファイルを転写しますか? =これは http://code.google.com/p/pyspeech/ について話します。 http://code.google.com/p/dragonfly)も参照してください。 /

31
Michael Levy

テキスト読み上げ(音声生成)の主要なAPIベンダーは、 YAKiToMe! とiSpeechです。 YAKiToMe!私が使用しているのは、彼らの音声品質が最も好きで、最も安価(ほとんど無料)だからです。彼らは複数の言語で男性と女性の話者をサポートしています。 Acapella、Nuance、Loquendo、iVonaなどの一部の音声ベンダーはまともな音声を持っていますが、使用するのに費用がかかる傾向があります。

2
Richard

方法は次のとおりです。注:これはGoogleのAPIであるため、chromeブラウザでのみ機能します。

(ライブデモを参照し、ここから完全なソースコードをダウンロードしてください http://purpledesign.in/blog/?p=

ボタンを定義する

<input id="speech" type="text" speech="speech" x-webkit-speech="x-webkit-speech" onspeechchange="processspeech();" onwebkitspeechchange="processspeech();" />

javascriptファイルの関数で何をしたいかを定義します

このような

   function processspeech()
   {
     var speechtext=$("#speech").val();
     var elem = document.getElementById("test");
     elem.value = speechtext;
     var notification="\"<span style=\"color:#F00; text-transform:uppercase;\">"+  speechtext + "</span>\" <br />*Is this what you said???";
    notify(notification);
}

ここに

<textarea> id="test"></textarea>

スピーチはテキストエリアに書かれています

1
Raj Sharma