108年第2學期-5700 統計學習專題 課程資訊

評分方式

評分項目 配分比例 說明
期中考 30
期末報告 30
作業 30
平時表現和出席 10

選課分析

本課程名額為 70人,已有6 人選讀,尚餘名額64人。


登入後可進行最愛課程追蹤 [按此登入]。

授課教師

蔡清欉 張玉媚

教育目標

本課程主要是針對統計系及資工系開課,也歡迎管理學院修習過統計學課程的學生選修。透過課程講授、個人作業與分組期末報告,在學期末時,修課學生應該具備下面的觀念與技能: (1) 了解什麼資料用什麼方法。 (2) 瞭解資料分析與探勘的過程與步驟方法。 (3) 使用R或Python軟體進行程式撰寫與統計分析。 (4) 視覺化資料進行溝通。 (5) 針對一個有趣或產業的問題,運用教授的統計學習與R、Python語言,進行真實資料的分析。

課程概述

本課程目標培育Data+人才,所謂Data+人才能處理大數據、統計與機器學習模型、解讀分析結果,透過學習統計學、資料科學、機器學習技術能直接有效地解決實際問題。課程內容是基於統計信息理解數據的框架,可以將其分為有監督式學習或非監督式學習,也可以說是對複雜資料分析與建模的工具和方法。它是統計領域的一個近期發展領域,與計算機科學特別是機器學習並行發展融為一體。本課程介紹不同型態與複雜度的資料,包含資料清理、特徵選擇處理及常用的統計與機器學習方法,例如:迴歸、分類和迴歸樹以及Boosting和Support Vector Machine、廣義估計模式(GEE)、自動挑選分類技術的最佳設定參數方法、最常見的問題不平衡資料 (imbalanced data) 的處理、集群分析 (clustering analysis)與其他多變量方法及集成學習 (ensemble learning)、卷積神經網路(CNN)、RNN、訓練及優化類神經網路。每個方法都搭配實例演練與分析,R語言、python語言、 TensorFlow /Keras是課程必備,期末專題同學組隊接受Kaggle競賽挑戰。

課程資訊

參考書目

1.Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani, An Introduction to Statistical Learning with Applications in R.
2.Trevor Hastie, Robert Tibshirani and Jerome Friedman, The Elements of Statistical Learning, Data Mining, Inference, and Prediction. Second Edition.
3.R語言機器學習。吳金朝 譯。

開課紀錄

您可查詢過去本課程開課紀錄。 統計學習專題歷史開課紀錄查詢