web-dev-qa-db-ja.com

スタークラフトAIプログラミングの取り組みのためのダブルニューラルネットワークアーキテクチャ

このAIシステムアーキテクチャの提案をご覧ください。

Double neural network architecture proposal

ご覧のとおり、これは BWAPI AIフレームワーク を使用するスタークラフトのブルームウォー用のマルチエージェントAIシステムであり、2つの主要なニューラルネットワークで構成されるボットインフラストラクチャアーキテクチャに対してこのアイデアを提案しました。これらは管理の特定のタスクに置かれました。

だからここにあなたたちのための質問です:そのタイプのアーキテクチャは意味がありますか? 2つの特定のフィールドで意思決定を分割することは役に立ちますか?

はいの場合、これらの2つのニューラルネットワークを効果的に連携させるために、フィードバックループを作成するにはどうすればよいですか。

4
Nylithius

これはあなたが着手する非常に興味深いプロジェクトです。しかし、それはまた非常に困難になります

マルチエージェントアーキテクチャ

マルチエージェントシステム の設計を開始しました。戦略エージェントと戦術エージェントの2つのアクティブエージェントがあります。

どちらも独自のコマンドでゲームコントロールAPIを提供します。エージェントが他に入力を送信する「フィードバックループ」があります。

直感的には、プレイヤーのようにゲームに与えられるコマンドを優先するために、調整エージェントが欠落していると思います。

欠けているのは、計画の調整です。たとえば、戦術エージェントがいくつかのユニットにいくつかのアクションを実行させたいが、戦略エージェントが、ユニットの準備ができる前にゲームを失うと判断した場合はどうなるでしょうか。 マルチエージェント計画 は、予想した2つよりも多くのエージェントを必要とする場合があります。

マルチエージェントシステムの利点は、通信メカニズムを実装した後、エージェントを追加できることです。各エージェントは独自のパラダイムを持つことができるため、ニューラルネット、ルールベース、 alpha-betaプルーニング などを混合して、計画またはその評価に貢献できます。

ニューラルネット

ニューラルネット には魔法はありません。学習ループを介してそれらをトレーニングする必要があります。実験システムでは、構成を認識してアクションをトリガーするなどの単純なタスクは簡単です。または、入力パターンに応じていくつかのアクションから選択します。ただし、マルチステッププランでは簡単ではありません。まず、出力チェーンにタイミングがありません。そして、あなたは戦術が数ラウンドと数回の移動の後にのみ良いものであったかどうかを知るかもしれません。それが失敗した場合、あなたはすべての動きが悪いのか、それとも1つだけ(そしてどれが悪いのか)を知ることができません。では、どのようにして積極的に、または否定的に取られた動きを強化するのですか?

したがって、マルチエージェントを利用して、パターンを認識するニューラルネット機能を他の手法と組み合わせることができます。

2
Christophe