強化学習
BipedalWalker-V3
LunarLanderとほぼ同じソース.モデルの箇所を変更すると動く. import imageio import numpy as np import gymnasium as gym from stable_baselines3 imp...
LunarLander-v2
LunarLanderのサンプル. 学習step 2e6(2,000,000)回レベルだと着陸までいかない・・・? import gymnasium as gym from stable_baselines3 import DQN from...
Stable Baselines3サンプル
公式から拝借. コード内に記載がありますが,私の環境(MacBook Air Apple M1 Sonoma 14.1.1)では以下を事前に実施しないとエラーとなった. HomeBrewが入っていない方はインストールした後,以下を実施してく...
CarPole サンプル
2023/11時点,gymのメンテは中止とのこと. 後継のgymnasiumを利用した方が良さそう. # import imageio import numpy as np import gymnasium as gym from stab...
Stable Baseline 3
Stable Baseline3で使える環境の紹介.
baseline3 zooの代表的な環境,Classic Control,box-2d Environment,atari Gamesで使える強化学習手法とgifデモ.