105年第2學期-6238 巨量資料分析與應用 課程資訊
評分方式
評分項目 | 配分比例 | 說明 |
---|---|---|
平時作業與點名 | 40 | 平時作業含專題製作 |
期中考 | 30 | |
期末考與期末分組專題 | 30 |
選課分析
本課程名額為 40人,已有34 人選讀,尚餘名額6人。
登入後可進行最愛課程追蹤 [按此登入]。
教育目標
本課程將以實際的巨量資料為核心,讓學生接觸實際的巨量資料計畫,並學習相關的方法與技術。 課程會就資料的背景、來源、要解決的問題及相關的domain knowledge做說明。 接著,針對以下四個主題:1.資料搜集、儲存與整理;2.模型建立與分析方法;3.結果呈現、說明與視覺化;4.分析流程自動化軟體的雛型製作, 講述相關既存的概念、方法與實作工具,接著針對新穎方法進行討論。
世界上的資料量正在迅速增長。大型綜合巡天望遠鏡(Large Synoptic Survey Telescope, LSST)計畫,每晚可收集約20 TB (1 TB=1000 GB) 的天文資料;單一醫學機構只要花一天,就能完成人類30億個鹼基對的定序;美國股市每天大約會成交70億股;網路公司,像Google每天得處理超過24 PB (1 PB=1000 TB) 的資料,Facebook每小時會收到超過1千萬張新照片、30億次的留言,YouTube用戶每秒上傳的影片總長度超過1小時。巧妙運用這些「巨量資料」(big data),將可為我們的生活從醫療、政府、教育、經濟、人文各個方面,帶來新的價值與創新。然而巨量資料的內容常常是混亂不齊、品質不一,而且分布在無數伺服器中。因此如何從巨量資料裡,引出潛藏其中的價值,便成為現在最急迫的工作,一個新的科學領域:資料科學(data science)也孕育而生。(參考來源:http://www.stat.nctu.edu.tw/data/super_pages.php?ID=data1)
課程資訊
基本資料
選修課,學分數:0-3
上課時間:三/10,11,12[M023]
修課班級:資管系4,碩1,2
修課年級:年級以上
選課備註:
教師與教學助理
授課教師:姜自強
大班TA或教學助理:尚無資料
Office Hour三/9 M418
授課大綱
授課大綱:開啟授課大綱(授課計畫表)
(開在新視窗)
參考書目
1. 講義與SAS原廠教案。
2. 應用 R 語言於資料分析- 從機器學習、資料探勘到巨量資料。
開課紀錄
您可查詢過去本課程開課紀錄。 巨量資料分析與應用歷史開課紀錄查詢