web-dev-qa-db-ja.com

q-learning

強化学習を継続的なアクションスペースに適用するにはどうすればよいですか？

QラーニングとValue Iterationの違いは何ですか？

Q学習vs時間差vsモデルベース強化学習

強化学習とディープRLの違いは何ですか？

DQN-Q-Lossが収束しない

イプシロン欲張りq学習におけるイプシロンと学習率の減衰

QラーニングとSARSAの違いは何ですか？

ケラスの政策勾配

誰でも教師付き学習と教師なし学習の実際の例を挙げることができますか？

教師あり学習と教師なし学習の違いは何ですか？

グラデーションポリシーの派生を理解する

Djangoのビューで2つ以上のクエリセットを組み合わせるにはどうすればいいですか？

DjangoでORクエリフィルターを動的に作成する方法は？

Django ANDとORを組み合わせたクエリフィルターは、Qオブジェクトで期待どおりの結果を返しません

Qを使用してnode.jsプロミスチェーンを適切に中止するにはどうすればよいですか？

django qオブジェクトで動的にフィルタリングする

プロミスにはjQueryまたはQ.Jsを使用します

promiseの使用-フェイルハンドラーでスタックトレースをログに記録する

AngularJSでqを使用する複数のチェーン遅延関数がデータを返さない

Angular $ q.whenはどのように機能しますか？

JavaScript Qライブラリで同期を約束できますか？

約束のあるwhileループ

yyyy-mm-ddをddmmyyyyに変換する

Qで可変数のプロミスを順番にチェーンする方法は？

Angular $ q promiseが解決されたかどうかを確認する方法

複雑なpromiseの配列でQ.all（）を使用するにはどうすればよいですか？

Kriskowalのqで複数回拒否/解決するとどうなりますか？

AngularJSの約束、$ q、延期

Q.jsで条件付き（？）プロミスを正しくチェーンする方法

Angularjs $ q.all

QPromisesでthen関数をスキップする適切な方法

Node.js非同期ライブラリの比較-Qと非同期

約束は単にコールバックではありませんか？

node.jsでQプロミスを実際に使用するにはどうすればよいですか？

Qのように空のBluebirdプロミスを定義する

マングースと約束：クエリ結果の配列を取得する方法は？

約束の後の戻り値

jQuery $ .Deferred固有の問題（jQuery 1.x / 2.x）

明示的な約束の構築の逆パターンとは何ですか？また、どうすればそれを回避できますか？

約束が解決されるのを待つ方法は？

約束を次々と（すなわち順番に）解決しますか？

NodeJSを介してエンドポイントにAjaxリクエストを行う方法

Pythonで調整されたp値を計算する

angularjs $ qでプロミスを順番にチェーンするにはどうすればよいですか？

約束：成功するまで操作を繰り返しますか？

返り値とthen（）からのPromise.resolveの違いは何ですか

オブジェクトがPromiseであるかどうかはどうすればわかりますか？

Node.jsでコールバックをプロミスに置き換える

プロミスから複数の値を適切に返すにはどうすればよいですか？

renderメソッド内でのReactコンポーネントのPromiseのレンダリング

Promiseを使用するときに、クラスメソッド内で「this」が未定義なのはなぜですか？

ES6のプロモーションがあるのに、QやBlueBirdのようなプリズムライブラリを使用する理由はまだありますか？

Java-文字列を数字と文字で分割

Spring Bootで追加のクラスパスを構成する方法は？

人工ニューラルネットワークのニューロン数と層数の推定

ニューラルネットワークを訓練するときのエポック対反復

視覚入力を使用してDiablo 2をプレイするために人工ニューラルネットワークをトレーニングする方法

人工ニューラルネットワークではなく、サポートベクターマシンをいつ使用する必要がありますか？

バックプロパゲーションニューラルネットワークで非線形活性化関数を使用する必要があるのはなぜですか？

多層パーセプトロン（MLP）アーキテクチャ：隠れ層の数と隠れ層のサイズを選択するための基準？

強化学習によるニューラルネットワークのトレーニング

弱い学習者とは何ですか？

オーディオ用の畳み込みニューラルネットワーク（CNN）

sklearn GradientBoostingClassifierでカテゴリ変数を処理する方法は？

Theanoの畳み込みニューラルネットワークの教師なし事前トレーニング

sklearn.ensemble.AdaBoostClassifierはSVMをbase_estimatorとして受け入れられませんか？

scikit-learn（またはその他のpythonフレームワーク）を使用したさまざまな種類のリグレッサーのアンサンブル

Caffeの「lr_policy」とは何ですか？

バックプロパゲーションアルゴリズムは、微分不可能な活性化関数をどのように処理しますか？

クラスの不均衡への取り組み：損失とSGDへの寄与のスケーリング

Scikit-learn：True Positive、True Negative、False Positive、False Negativeを取得する方法

convert_imageset.cppのガイド

Neuroevolutionでニューラルネットワークの重みを進化させる方法は？

Caffeの「weight_decay」メタパラメーターとは何ですか？

畳み込みニューラルネットワークの深さとは何ですか？

トレーニング中のナンの一般的な原因

事前学習済み（Tensorflow）CNNを使用して特徴を抽出する

機械学習モデルのための「損失」と「正確さ」の解釈方法

テンソルフローのtf.nn.dropoutで入力がスケーリングされるのはなぜですか？

DeConvNetでのプール解除とデコンボリューションの仕組み

TensorFlowを使用した不均衡なデータのトレーニング

Tensorflowでは、sampled_softmax_lossとsoftmax_cross_entropy_with_logitsの違いは何ですか

テキストデータを分類するための単純ベイズとSVM

ニューラルネットワークの層とノードの数を決定する方法

小さな画像データセットのためのデータ増強技術？

TensorFlowでグラデーションクリッピングを適用する方法は？

GoogLeNetモデルの微調整

Python / Keras-各エポック予測にアクセスする方法は？

KerasのDenseメソッドでレイヤーのサイズを決定する方法は？

Tensorflowのデフォルトの変数初期化子は何ですか？

値の反復とポリシーの反復の違いは何ですか？

Binary_crossentropyとCategorical_crossentropyの混同

最大プーリングVS合計プーリング

TensorFlowで用語「テンソル」を理解する方法は？

model.predict（）とmodel.fit（）は何をしますか？

複数のクラスでトレーニングするときにKerasでラベルIDを取得するにはどうすればよいですか？

機械学習の特定の機能により重点を置く方法は？

LSTMネットワークのパラメーター数を計算する方法は？

TensorFlow-L2損失を伴う正則化、最後の重みだけでなく、すべての重みに適用する方法？

TensorFlow-L2正規化とドロップアウトの両方をネットワークに導入します。それは理にかなっていますか？