本章では、強化学習(Reinforcement Learning, RL)を用いた制御設計手法を学びます。
制御対象とのインタラクションを通じて最適な行動ポリシーを獲得し、モデルフリーな自律制御を実現します。
part07_rl_control/
├── theory/ # 理論資料(Markdown)
│ ├── 01_rl_basics.md
│ ├── 02_cartpole_ddpg.md
│ ├── 03_rl_vs_classical.md
├── simulation/ # 実装コード
│ ├── cartpole_ddpg.py
│ └── ppo_pendulum.py
├── notebooks/ # 可視化や訓練経過分析用Notebook
│ └── ddpg_training_log.ipynb
├── figures/ # 図版(構造図、学習曲線など)
└── README.md
内容 | ファイル名 |
---|---|
倒立振子 DDPG実装 | cartpole_ddpg.py |
PendulumへのPPO適用 | ppo_pendulum.py |
学習ログの可視化 | ddpg_training_log.ipynb |
タイトル | ファイル |
---|---|
強化学習の基本構造と用語解説 | 01_rl_basics.md |
倒立振子制御へのRL応用 | 02_cartpole_ddpg.md |
古典制御との違いとハイブリッド展開 | 03_rl_vs_classical.md |