web-dev-qa-db-ja.com

音声認識とプログラミング

プログラミングに関して、Dragon Naturally Speaking音声認識ソフトウェアで成功した人はいますか?

手でタイプするよりもずっと速く、カーポールトンネルで簡単にできると思います。

Visual Basic 6 IDE、Visual Studio 2008 IDE +チームエクスプローラー、メールの作成、Windows Live IMを介したチャットで日々プログラミングを行っています。

音声コマンドをキーストロークにバインドしたり、つづり/単語を言う/スペースなしで単語を言うなどを切り替えることができるコマンドベースのインターフェイスが必要です。

コメントは大歓迎です。

31
bitcycle

「音声プログラミング」「音声プログラミング」の方が「音声認識プログラミング」の方がいいと思います。試されましたが、まだ定着していません。

  • これがオープンソースプロジェクトです: VoiceCode 。これが 動作中のビデオ です。ボイスコード 1年以上使用されていないようです 再びアクティブになっているようです。
  • これがオープンソースプロジェクトです: ShortTalk and EmacsListen 。これが 動作中のビデオ です。
  • 検索で出てくるもう1つのオプションは Harmonia です。

私がすべて読んだ実際のアカウントは、声によるプログラミングは声帯で難しい場合があることに同意するようです。それから彼らはそれがどのように良くなっているかを言い続け、本当に使えるシステムがすぐそこにあるかもしれません。それを最初に読んだのは1990年代後半だった...

20
dmckee

私は汎用の音声認識を使用してプログラミングしようとしましたが、プログラミングは通常の話し言葉とはかけ離れているという結論に達しました。コーディングに合わせた特定の文法が必要です(必ずしも言語固有ではありません)。この経験の結果として、私は音声認識を使用したプログラミングを検討しました。それはまだ概念の証明にすぎませんが、ある程度は実行可能だと私は思います。

考慮事項:

  • 健康で、両手でフルスピードでコーディングできる場合は、キーボード/マウスの方が速くなります。私は約60 wpmで入力しますが、音声で速く進む方法はありません。しかし、私は片手で非常に遅いタイパーです。声だけで行くのではなく、音声コマンドでアシストすることで、腕への負担を大幅に軽減できると思います。
  • プログラミング内には、コーディング/タイピングではないアクティビティがありますIDE。コーディング/タイピングではありません。これらのタスクの多くを音声を使用して実行できるようになると、さらに負担が軽減されます。
  • 誰もが座ってコンピューターと話すことが可能な環境で働くわけではありません。

POCの短いビデオがYoutubeにあります。 http://www.youtube.com/watch?v=x3Lm9nrFeMk

5
Kim Major

ディクテーションは通常、言語モデル(音素から文字列へのマッピング)を持つことで機能します。残念ながら、プログラミングの言語モデルは英語にうまく適合しないため、認識エラー率は非常に高くなります。

間隔とナビゲーションはあなたの心配の最小です。マクロのセットを作成して、コードに関するVisual Studioの知識(gotoメソッドなど)を利用できます。

IMと電子メールはDNS(またはWindows音声認識)で適切に処理されます。

4
Eric Brown

音声認識は、プログラミングに必要なキーストロークの数を減らすのに役立つと思います。私はDragon NaturallySpeakingを使用してPHPコードを記述しており、頻繁に使用されるステートメントを出力するためにいくつかのコマンドを作成しました。他の人が述べたように、コード内のナビゲーションは困難です。可能な限り多くの方法でプログラミングを最小限に抑えるために繰り返し負担を負うことです。たとえば、モニターに座る前に慎重に行うことを考えます。ペンと鉛筆を使用して疑似コードを記述します。コードを再利用可能にしますできるだけプログラミングのベストプラクティスを守ってください。画面から離れて、本を読んでください。仕事の位置を変えてください。iPadを使って床に横になっています。Android短いメールに答えるための音声認識やテキストメッセージ。無料で多言語対応であり、静かな環境ではかなり正確です。立ち上がって歩き回ってください。誰かにプログラミングを依頼してもらうことを検討してください。

3
Stephen

数年前に両手首の手根管に似たRSI(腱滑膜炎)を開発したので、コーディングのために音声に切り替えたいというニーズを確実に理解できます。

残念ながら、ちゃんとした方法で仕事を成し遂げることは本当にそれほど多くありません-すでに述べたように、コードナビゲーションは音声だけでは非常にイライラします、そしてプログラマーが必要とする珍しい文字の幅広い配列は問題を助けません汎用!

私は個人的にDragon Naturally Speakingを約3か月間使用していましたが、最終的には長期的な解決策としては機能しないと判断しました。理学療法士から、エルゴノミックキーボード Maltron (Maltronレイアウトを使用)を具体的に試すことを提案されました。標準のキーボードを使用して苦痛で不自由になることを考えると、1日中苦痛なくコーディングできるようになりました。彼らはあなたがそれを試すことができるようにレンタルモデルをします(または慣れました)。現在キーボードを使用する立場にない場合でも、将来的に検討する価値があるかもしれません。

3
Wayne Cornish

私は両方の手首に腱鞘炎を発症し、基本的なタイピングを行うためにドラゴンを約2年間使用しました。私には基本的なプログラミング能力がありますが、コーディングにdragonを使用するのは非常に面倒で、その結果、別のキャリアパスを選択することになりました。私はMicrosoftの人間工学に基づいたキーボードとevoluentマウスを使用していますが、何時間にもわたってタイピングやマウス操作を行うことはできません。

ドラゴン用のコマンドのライブラリは(言語ごとに)書くことができると思いますが、キーボードの真の代替にはなりませんでした。

2
Jesse Rundle

音声認識が本当にあなたの問題を解決できるかどうかはわかりません-だけではありません記号が多すぎます自然言語ではめったに使用されませんが、プログラミングでは一般的です(中かっこ、セミコロン、引用符)?

しかし、おそらくエクスペリエンスを最も妨げるのは、通常のテキストとは異なり、コードが直線的に記述されることはほとんどありませんが、行、メソッド、およびクラスの間でジャンプすることです(少なくとも、私はそれをよく行います)。もちろん、このために追加の音声コマンドを見つけることもできますが、全体的なエクスペリエンスは満足できるものではないでしょう。

1
Roland Ewald

PSPDの詳細については、次のリンクにアクセスしてください。 http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?arnumber=5072009

この論文は、音声認識システムの精度を改善するための位相空間点分布パラメータを抽出する方法を提示します。非線形またはカオス信号処理技術を利用して時間領域ベースの位相空間特徴を抽出することにより、音声認識の方法が提案されます

1
arun