111年第1學期-1058 強化學習 課程資訊
評分方式
評分項目 | 配分比例 | 說明 |
---|---|---|
期中專題 | 20 | |
期末專題 | 30 | |
作業 | 30 | |
課堂出席 | 20 |
選課分析
本課程名額為 60人,已有42 人選讀,尚餘名額18人。
登入後可進行最愛課程追蹤 [按此登入]。
教育目標
本課程學習各種強化學習技術和方法,並學習如何將AI人工智慧集成到各種遊戲與實際應用專案。本課程從基礎開始,學習馬爾可夫決策過程、Actor Critic方法、策略梯度算法、DQN等基礎方法。接著學習進階增強學習方法,像是A3C、PPO、分散式RL、以及exploration等。本課程案例使用Unity ML-Agent、openai gym 等平台做為學習環境,案例研究包括Atari遊戲、2048遊戲、自駕賽車、AlphaGo、投資分析、電網排程等主題。
課程資訊
基本資料
選修課,學分數:3-0
上課時間:三/8,9,10[ST436]
修課班級:資工系3,4
修課年級:年級以上
選課備註:AI組分組選修
教師與教學助理
授課教師:陳隆彬
大班TA或教學助理:尚無資料
Office Hour二 6,7 (14:10-16:10) [ST327]
授課大綱
授課大綱:開啟授課大綱(授課計畫表)
(開在新視窗)
參考書目
1. 書名 Deep Reinforcement Learning Hands-On
出版社 Packt Publishing
作者 Maxim Lapan
出版年 2018
2. 書名 Hands-On Reinforcement Learning with Python: Master reinforcement and deep reinforcement learning using OpenAI Gym and TensorFlow
出版社 Packt Publishing
作者 Sudharsan Ravichandiran
出版年 2018
開課紀錄
您可查詢過去本課程開課紀錄。 強化學習歷史開課紀錄查詢