web-dev-qa-db-ja.com

Chrome "x-webkit-speech"入力要素の音声認識が組み込まれていますか?

どのように疑問に思います

<input type="text" x-webkit-speech speech />

Chromeに組み込まれている音声認識エンジンはありますか、それともオペレーティングシステムの基盤となる音声認識機能にアクセスしていますか?

17
Tickle Me Elmo

うん、ChromeはGoogleのサーバーを介して音声認識を行います。しかし、他のブラウザがそれを別の方法で実装することを選択できなかった理由はありません(たとえば、OSの音声認識機能を使用)。

バル、あなたのリンクは実際には少し古くなっています。最新のGoogleの提案はここにあります: http://www.w3.org/2005/Incubator/htmlspeech/2010/10/google-api-draft.html

音声認識はChrome devチャネルでしばらくの間利用可能でしたが、まだ出荷されておらず、いつ出荷されるかはまだわかりません。APIを試してフィードバックを提供してもらいたいのですが、まだプライムタイムの準備が整っていないと思います。

13
jorlow

コードによると、オーディオデータをPOSTリクエストとして次の宛先に送信します:

https://www.google.com/speech-api/v1/recognize?client=chromium&lang=??&lm=??&xhw=??&maxresults=3

lmはコードではgrammarであり、xhwhardware_infoコメントによるとオプションです。音声はspeex、x-speex-with-header-byteのようです。

// Encode the frame and place the size of the frame as the first byte. This
// is the packet format for MIME type x-speex-with-header-byte.

自分のアプリで使用するようにchromeコードを変更するのは、かなり簡単なようです。

更新:

また、 音声認識APIキー を取得する必要があり、それらは1日あたり50リクエストに制限されています。その制限を増やす方法はありません-支払っても。

9
Timmmm

X-speex-with-header-byte MIMEバイナリ形式をエンコードできるspeexencの実験的なフォークがあり、 QXIP Wiki で参照され、 GitHub で入手できます。フレームのサイズをパケットの最初のバイトとして配置することにより、ジョブは正常に実行されますか。

6
Mike Z.

彼らは音声認識に独自のAPIを使用しています。例:そこのサーバーにPOSTリクエストを送信します。

6
ciju

これは興味深いかもしれません https://github.com/taf2/speech2text Ruby Google Speech to TextAPIのバインディング

2
todd

この機能は、chrome 11ベータ版で機能するようになりました。

これをチェックしてください。

http://slides.html5rocks.com/#speech-input

2
Jay

音声認識はGoogleによる提案です。 https://docs.google.com/View?id=dcfg79pz_5dhnp23f5

この機能はChrome 8+に付属しており、実際の認識を実行するためにデータをGoogleサーバーに送信するようです。

2
balu

はい、ChromeにはWebKitを介した音声サポートが組み込まれています。Googleホームページ(検索ボックスの右側にマイクがあります)を見てください。ただし、 ChromeチームはOmnibox音声サポートに取り組んでいます。結局のところ、ChromeはWebKitベースのブラウザです!

1
Kenny Strawn

http://www.w3.org/TR/xhtml+voice/ を作成したワーキンググループもありますが、これはOpera以外のブラウザには実装されていないと思います。

0
Michael Levy

Chrome Cr-48でこれを確認しました、動作します。

0