105年第2學期-6238 巨量資料分析與應用 課程資訊

課程分享

選課分析

本課程名額為 40人,已有34人選讀,尚餘名額6人。

評分方式

評分項目 配分比例 說明
平時作業與點名 40 平時作業含專題製作
期中考 30
期末考與期末分組專題 30

授課教師

姜自強

教育目標

本課程將以實際的巨量資料為核心,讓學生接觸實際的巨量資料計畫,並學習相關的方法與技術。 課程會就資料的背景、來源、要解決的問題及相關的domain knowledge做說明。 接著,針對以下四個主題:1.資料搜集、儲存與整理;2.模型建立與分析方法;3.結果呈現、說明與視覺化;4.分析流程自動化軟體的雛型製作, 講述相關既存的概念、方法與實作工具,接著針對新穎方法進行討論。 世界上的資料量正在迅速增長。大型綜合巡天望遠鏡(Large Synoptic Survey Telescope, LSST)計畫,每晚可收集約20 TB (1 TB=1000 GB) 的天文資料;單一醫學機構只要花一天,就能完成人類30億個鹼基對的定序;美國股市每天大約會成交70億股;網路公司,像Google每天得處理超過24 PB (1 PB=1000 TB) 的資料,Facebook每小時會收到超過1千萬張新照片、30億次的留言,YouTube用戶每秒上傳的影片總長度超過1小時。巧妙運用這些「巨量資料」(big data),將可為我們的生活從醫療、政府、教育、經濟、人文各個方面,帶來新的價值與創新。然而巨量資料的內容常常是混亂不齊、品質不一,而且分布在無數伺服器中。因此如何從巨量資料裡,引出潛藏其中的價值,便成為現在最急迫的工作,一個新的科學領域:資料科學(data science)也孕育而生。(參考來源:http://www.stat.nctu.edu.tw/data/super_pages.php?ID=data1)

課程資訊

參考書目

1. 講義與SAS原廠教案。
2. 應用 R 語言於資料分析- 從機器學習、資料探勘到巨量資料。