109年第2學期-1061 增強學習 課程資訊
評分方式
評分項目 | 配分比例 | 說明 |
---|---|---|
期中專題 | 20 | |
期末專題 | 30 | |
作業 | 30 | |
課堂出席 | 20 |
選課分析
本課程名額為 70人,已有14 人選讀,尚餘名額56人。
登入後可進行最愛課程追蹤 [按此登入]。
教育目標
本課程學習各種強化學習技術和方法,並學習如何將AI人工智慧集成到各種遊戲與實際應用專案。本課程從基礎開始,學習馬爾可夫決策過程、Actor Critic方法、策略梯度算法、DQN等基礎方法。接著學習進階增強學習方法,像是A3C、PPO、分散式RL、以及exploration等。本課程案例使用Unity ML-Agent、openai gym 等平台做為學習環境,案例研究包括Atari遊戲、2048遊戲、自駕賽車、AlphaGo、投資分析、電網排程等主題。
課程資訊
基本資料
選修課,學分數:0-3
上課時間:三/7,8,9[C106]
修課班級:資工系3,4
修課年級:年級以上
選課備註:
教師與教學助理
授課教師:陳隆彬
大班TA或教學助理:尚無資料
Office Hour二 6,7 (14:10-16:10) [ST327]
授課大綱
授課大綱:開啟授課大綱(授課計畫表)
(開在新視窗)
參考書目
書名 Deep Reinforcement Learning Hands-On
出版社 Packt Publishing
作者 Maxim Lapan
出版年 2018
開課紀錄
您可查詢過去本課程開課紀錄。 增強學習歷史開課紀錄查詢