112年第2學期-6189 大數據時代下的機率統計思維 課程資訊

評分方式

評分項目 配分比例 說明
課堂參與 30
作業 20
期末報告 50

選課分析

本課程名額為 70人,已有6 人選讀,尚餘名額64人。


登入後可進行最愛課程追蹤 [按此登入]。

授課教師

林正祥

教育目標

大數據時代,大家都在談論”大數據”。可是,到底大數據時代的本質是什麼? 彷彿一夜之間,“大數據”成了家喻戶曉的常用詞,不論新興行業還是傳統行業,都準備“擁抱大數據”,都想從大數據中發現寶藏。 統計與大數據有何區別?大數據分析結果如何解讀,是為探討的重點:(1)大數據所代表的母體是哪一個母體,是原先預期的母體嗎?(2)大數據分析結果準確嗎?錯了怎麼辦?影響有多大?(3)非傳統資訊的量化是否正確?誤判的後果為何?解答似乎就在統計的理論中。 透過統計方法分析資料,我們做出具有錯誤率控制保證的推論,統計分析成了決策的重要依據。 在大數據時代的潮流下,人們對於數據越來越重視,研究和分析數據的理論和方法越來越豐富,統計學越來越發揮出它的作用,在各個領域都體現出應用價值。無論是人工智能技術下的超級AI,還是海量數據中的深度學習技術,或者是以假亂真的虛擬現實,統計學都是它們賴以存在的理論基礎。本課程以科普的角度從應用機率的觀點出發並論及統計分析模型所扮演的角色,進而邁入大數據的範疇,這其中包括統計與大數據異同發展且相輔相成的過程,最後亦論及人工智慧發展的利弊得失。

課程概述

大數據時代,大家都在談論”大數據”。可是,到底大數據時代的本質是什麼? 彷彿一夜之間,“大數據”成了家喻戶曉的常用詞,不論新興行業還是傳統行業,都準備“擁抱大數據”,都想從大數據中發現寶藏。可是,大數據究竟是什麼?是新瓶裝舊酒,還是技術革命? 傳統數據庫技術無法處理海量、高增長率、多樣化的大數據,革命性的新處理模式應運而生。大數據是創新,更是革命,海量的數據不僅可以用作統計分析,還可以用作產生“智慧”。 大數據到底比傳統得資料分析好在哪裡,最少有三方面可以觀察: (1) 資料數量大,幾乎等於母體,可以看到傳統抽樣調查看不到的小地方。 (2) 資料累積快速,可以即時呈現各種機會。 (3) 彙整非傳統的資料來源(例如網路、多媒體、文字等)、可以看到前所未見的資訊。 統計與大數據有何區別?大數據分析結果如何解讀,是為探討的重點: (1) 大數據所代表的母體是哪一個母體,是原先預期的母體嗎? (2) 大數據分析結果準確嗎?錯了怎麼辦?影響有多大? (3) 非傳統資訊的量化是否正確?誤判的後果為何?解答似乎就在統計的理論中。 透過統計方法分析資料,我們做出具有錯誤率控制保證的推論,統計分析成了決策的重要依據。大數據浪潮之初,資料處理的技術似乎超越了一切。大數據代表的是哪一個母體的資訊,很少被提及;統計學家也憂心在這一波大數據浪潮中被邊緣化,紛紛提出看法。 在大數據時代的潮流下,人們對於數據越來越重視,研究和分析數據的理論和方法越來越豐富,統計學越來越發揮出它的作用,在各個領域都體現出應用價值。無論是人工智能技術下的超級AI,還是海量數據中的深度學習技術,或者是以假亂真的虛擬現實,統計學都是它們賴以存在的理論基礎。事實上早在二、三十年前就有人提出數據科學的概念,惟統計主流學者認為分析技巧充其量不過是輔助統計推論的工具而已。就資料分析而言,統計自有其重要性,但已非主軸。 本課程從應用機率的觀點出發並論及統計分析模型所扮演的角色,進而邁入大數據的範疇,這其中包括統計與大數據異同發展且相輔相成的過程,最後亦論及人工智慧發展的利弊得失。

課程資訊

參考書目

王碧、牟昀譯 (2013),熵的神秘國度,天下文化出版社
王鴻龍 (2016),統計學在大數據時代的角色,主計月刊727:24-30
李帥 (2017),世界是隨機的-大數據時代的機率統計學,清華大學出版社
胡守仁譯(2009),隨機法則(The Drunkard's walk, L. Mlodnow)-左右你我的命運和機會,天下文化書坊
高英哲譯(2017)機率思考(Chancing IT, R. Mathews)-大數據時代,不犯錯的決斷武器,大牌出版社
馮啟思(2010),像統計學家一樣思考,高寶國際公司台灣分公司
黃文璋 (2003),隨機思考論,華泰書局
劉強編著 (2018),大數據時代的統計學思維,中國水利水電出版社
羅耀宗 (2014),隨機騙局,大塊文化
蘇子堯譯 (2019),精準預測,三采文化集團
陳宣、涂瑋瑛譯(2020)骰子能扮演上帝嗎?(Do dice play God?I. Steward)-18個不確定性的數學思考,商周出版社

開課紀錄

您可查詢過去本課程開課紀錄。 大數據時代下的機率統計思維歷史開課紀錄查詢