112年第1學期-1058 強化學習課程資訊

評分方式

評分項目	配分比例	說明
期中專題	20
期末專題	30
作業	30
課堂出席	20

選課分析

本課程名額為 60人，已有15 人選讀，尚餘名額45人。

登入後可進行最愛課程追蹤 [按此登入]。

授課教師

陳隆彬

教育目標

本課程學習各種強化學習技術和方法，並學習如何將AI人工智慧集成到各種遊戲與實際應用專案。本課程從基礎開始，學習馬爾可夫決策過程、Actor Critic方法、策略梯度算法、DQN等基礎方法。接著學習進階增強學習方法，像是A3C、PPO、分散式RL、以及exploration等。本課程案例使用Unity ML-Agent、openai gym 等平台做為學習環境，案例研究包括Atari遊戲、2048遊戲、自駕賽車、AlphaGo、投資分析、電網排程等主題。

課程資訊

基本資料

選修課，學分數：3-0
上課時間：五/6,7,8[ST436]
修課班級：資工系3,4
修課年級：3年級以上
選課備註：AI組分組選修

教師與教學助理

授課教師：陳隆彬
大班TA或教學助理：尚無資料
Office Hour四 6,7 (14:10-16:10) [ST327]

授課大綱

授課大綱：開啟授課大綱(授課計畫表)
(開在新視窗)

參考書目

1. 書名 Deep Reinforcement Learning Hands-On
出版社 Packt Publishing
作者 Maxim Lapan
出版年 2018

2. 書名 Hands-On Reinforcement Learning with Python: Master reinforcement and deep reinforcement learning using OpenAI Gym and TensorFlow
出版社 Packt Publishing
作者 Sudharsan Ravichandiran
出版年 2018

開課紀錄

您可查詢過去本課程開課紀錄。強化學習歷史開課紀錄查詢

112年第1學期-1058 強化學習課程資訊

評分方式

選課分析

授課教師

教育目標

課程資訊

基本資料

教師與教學助理

授課大綱

參考書目

開課紀錄

關於課程資訊網

站內連結

聯絡我們

112年第1學期-1058 強化學習 課程資訊

評分方式

選課分析

授課教師

教育目標

課程資訊

基本資料

教師與教學助理

授課大綱

參考書目

開課紀錄

關於課程資訊網

站內連結

聯絡我們

112年第1學期-1058 強化學習課程資訊