web-dev-qa-db-ja.com

Googleの音声認識技術用のAPIはありますか?

「次へ」や「前へ」などの簡単な音声コマンドを使用してjQueryスライドショーを作成してみたい。 Googleの音声認識を使用する方法はありますか? Chromeのx-webkit-speechについては知っていますが、使用するにはボタンをクリックする必要があります。

MITのWAMIを試してみましたが、Googleの音声認識よりも遅く、精度が低いことがわかりました。

22
Leo Jiang
21
Tim Perry

JavaScriptでこれを簡単に行う方法については、 annyang を確認してください。これは、音声認識の処理を非常に簡単にするライブラリです。

13
Tal Ater

問題は、ユーザーの音声をキャプチャし、処理のために音声サーバーを送信することです。 x-webkit-speechはブラウザに組み込まれており、ブラウザはPCのサウンドカードを使用して音声をキャプチャします。ブラウザだけのJavascript/Jqueryは、ハードウェアデバイスにアクセスできません。 ChromeがDOMのx-webkit-speechオブジェクトを公開しているかどうかわからないので、Javascriptを介してキャプチャできます。

そうは言っても、人々はGoogle Speech APIをリバースエンジニアリングし、コードから使用しました。例については http://mikepultz.com/2011/03/accessing-google-speech-api-chrome-11/ をご覧ください。

2
Michael Levy

私はこれを見つけました、私は個人的にそれを使用していません、それがあなたが探しているもの全体であるかどうかわかりませんが、見てください。

http://captico.com/introducing-speech-2-text-api-by-google/2011/

1
Roger