🧠 Part 7: 強化学習による制御 / Reinforcement Learning Control


言語 / Language GitHub Pages 🌐 GitHub 💻
🇯🇵 日本語 / Japanese GitHub Pages JP GitHub Repo JP

本章では、強化学習(Reinforcement Learning, RL)を用いた制御設計手法を学びます。
制御対象とのインタラクションを通じて最適な行動ポリシーを獲得し、モデルフリーな自律制御を実現します。

This chapter explores control design using Reinforcement Learning (RL).
By interacting with the environment, agents learn optimal policies for model-free and autonomous control.


🎯 学習目標 / Learning Objectives


📁 ディレクトリ構成(予定) / Directory Structure (Planned)

part07_rl_control/
├── theory/                   # 理論資料 / Theory Notes
│   ├── 01_rl_basics.md
│   ├── 02_cartpole_ddpg.md
│   ├── 03_rl_vs_classical.md
├── simulation/               # 実装コード / Simulation Scripts
│   ├── cartpole_ddpg.py
│   └── ppo_pendulum.py
├── notebooks/                # Notebook形式 / Analysis Notebooks
│   └── ddpg_training_log.ipynb
├── figures/                  # 図版 / Figures
└── README.md

🧪 実験コード(予定) / Experimental Code (Planned)

内容 / Description ファイル / File
倒立振子 DDPG実装
DDPG for cartpole
cartpole_ddpg.py
PendulumへのPPO適用
PPO on Pendulum
ppo_pendulum.py
学習ログの可視化
RL training visualization
ddpg_training_log.ipynb

🧠 理論資料 / Theory Notes theory/

タイトル / Title ファイル / File
強化学習の基本構造と用語解説
RL foundations and terminology
01_rl_basics.md
倒立振子制御へのRL応用
RL applied to cartpole control
02_cartpole_ddpg.md
古典制御との違いとハイブリッド展開
Comparison with classical control & hybridization
03_rl_vs_classical.md

🔜 今後の展開 / Next Steps


📚 参考資料 / References


👤 著者・ライセンス | Author & License

📌 項目 / Item 📄 内容 / Details
著者 / Author 三溝 真一(Shinichi Samizo)
💻 GitHub GitHub
📜 ライセンス / License Hybrid License
コード / Code: MIT
教材テキスト / Text: CC BY 4.0
図表 / Figures: CC BY-NC 4.0

⬅️ 前章 / Previous Chapter
ニューラルネットワークを利用した制御(NN-PID、逆モデル制御など)を扱います。
Covers neural network-based control methods such as NN-PID and inverse model control.

次章 / Next Chapter ➡️➡️
データ駆動型制御(Koopman演算子、行列識別など)を扱います。
Covers data-driven control methods including the Koopman operator and system identification.

🏠 トップページ / Back to Home