web-dev-qa-db-ja.com

OpenAI Gym: `action_space`表記(spaces.Box)を理解する

OpenAI _CarRacing-v0_環境でRLエージェントをセットアップしたいのですが、その前にアクションスペースを理解したいと思います。 githubのコード 行で119さんのコメント:

_self.action_space = spaces.Box( np.array([-1,0,0]), np.array([+1,+1,+1]))  # steer, gas, brake
_

この行を読むにはどうすればよいですか?私の問題は具体的なwrt _CarRacing-v0_ですが、spaces.Box()表記について一般的に理解したいと思います

18
Toke Faurby

Boxは、実際の値の数量を扱っていることを意味します。

最初の配列_np.array([-1,0,0]_は受け入れられる最小値で、2番目のnp.array([+1,+1,+1])は受け入れられる最大値です。この場合(コメントを使用)、3つの使用可能なアクションがあることがわかります。

  1. ステアリング:_[-1, 1]_で実際の値
  2. ガス:_[0, 1]_で実際の値
  3. ブレーキ:_[0, 1]_で実際の値
25
Toke Faurby