111年第1學期-1058 強化學習 課程資訊

評分方式

評分項目 配分比例 說明
期中專題 20
期末專題 30
作業 30
課堂出席 20

選課分析

本課程名額為 60人,已有42 人選讀,尚餘名額18人。


登入後可進行最愛課程追蹤 [按此登入]。

授課教師

陳隆彬

教育目標

本課程學習各種強化學習技術和方法,並學習如何將AI人工智慧集成到各種遊戲與實際應用專案。本課程從基礎開始,學習馬爾可夫決策過程、Actor Critic方法、策略梯度算法、DQN等基礎方法。接著學習進階增強學習方法,像是A3C、PPO、分散式RL、以及exploration等。本課程案例使用Unity ML-Agent、openai gym 等平台做為學習環境,案例研究包括Atari遊戲、2048遊戲、自駕賽車、AlphaGo、投資分析、電網排程等主題。

課程資訊

參考書目

1. 書名 Deep Reinforcement Learning Hands-On
出版社 Packt Publishing
作者 Maxim Lapan
出版年 2018

2. 書名 Hands-On Reinforcement Learning with Python: Master reinforcement and deep reinforcement learning using OpenAI Gym and TensorFlow
出版社 Packt Publishing
作者 Sudharsan Ravichandiran
出版年 2018

開課紀錄

您可查詢過去本課程開課紀錄。 強化學習歷史開課紀錄查詢