強化学習

強化学習

Box2D

BipedalWalker-V3

LunarLanderとほぼ同じソース.モデルの箇所を変更すると動く. import imageio import numpy as np import gymnasium as gym from stable_baselines3 imp...
Box2D

LunarLander-v2

LunarLanderのサンプル. 学習step 2e6(2,000,000)回レベルだと着陸までいかない・・・? import gymnasium as gym from stable_baselines3 import DQN from...
強化学習

Stable Baselines3サンプル

公式から拝借. コード内に記載がありますが,私の環境(MacBook Air Apple M1 Sonoma 14.1.1)では以下を事前に実施しないとエラーとなった. HomeBrewが入っていない方はインストールした後,以下を実施してく...
強化学習

CarPole サンプル

2023/11時点,gymのメンテは中止とのこと. 後継のgymnasiumを利用した方が良さそう. # import imageio import numpy as np import gymnasium as gym from stab...
強化学習

Stable Baseline 3

Stable Baseline3で使える環境の紹介. baseline3 zooの代表的な環境,Classic Control,box-2d Environment,atari Gamesで使える強化学習手法とgifデモ.