108年第1學期-5475 計算生物論文解析 課程資訊
評分方式
評分項目 | 配分比例 | 說明 |
---|---|---|
期中考 | 40 | |
期末考 | 40 | |
課堂表現 | 20 |
選課分析
本課程名額為 70人,已有2 人選讀,尚餘名額68人。
登入後可進行最愛課程追蹤 [按此登入]。
教育目標
1、本學期將選擇「胺基酸序列(amino acid sequence) 與蛋白質功能(protein function)之間的關係」 相關的學術論文。
2、此主題的意義:
了解胺基酸序列與蛋白質功能之間的關係,是分子生物學追尋的遠大目標,影響深遠,應用廣泛。到目前為止,仍有1/3的微生物蛋白質,我們仍不知其功能,更遑論其它更高等的生物。因此還有很長的路要走。
3、我們選擇以計算方法探討此問題的論文。其以蛋白質資料庫(譬如 Pfam)裡,已知胺基酸序列與蛋白質功能關係的資料,建立模型(譬如Deep learning、Hidden Markov models等),希望從胺基酸序列預測蛋白質功能。
4、Pfam 即為大數據;Deep learning 等,即屬 AI。
課程概述
何謂 “計算生物學” (或稱生物資訊學)? DNA由a,t,c,g 4個字母組合而成,如下例即為一串DNA序列(sequence): atgcactctt caatagtttt ggccaccgtg ctctttgtag cgattgcttc agcatcaaaa acgcgagagc tatgcatgaa atcgctcgag catgccaagg ttggcaccag caaggaggcg (習慣上,每10個字母寫成一小串,小串間以一“空白”隔開。此例計有120個字母,我們稱其長度為120) 人類DNA總長為30億,這30億個字母決定了一個人。1988年開始的人類基因計劃的主要目的,就是將這30億個字母寫出來。而這些字母是如何運作的,則有待進一步了解。這些隱藏於字母中的生命秘密,我們稱之為生物資訊(Biological information)。 DNA會製造出蛋白質,以營造活生生的生命。蛋白質由20個英文字母 (各代表一種氨基酸)組合而成,長度從數十至數百都有,如下例即為一條蛋白質序列: mhssivlatv lfvaiasask trelcmksle hakvgtskea kqdgidlykh mfehypamkk yfkhrenytp advqkdpffi kqgqnillac hvlcatyddr etfdayvgel marherdhvk 人類約有2萬條不同的蛋白質。這些蛋白質如何營造出生命,有待進一步了解。這些隱藏於字母中的秘密,也是所謂的生物資訊(Biological information)。 研究DNA如何運作及蛋白質如何營造生命, 也就是研究生物資訊(Biological information),是今日蓬勃發展的“生命科學”之目的。 所謂“生物序列”(Biological sequence),指的是DNA序列或蛋白質序列。 提出有效的生物序列分析方法(演算法或模型),以計算機為工具,挖掘隱藏在大量字母裡的生物資訊,我們稱之為“計算生物學”(Computational Biology),或稱之為“生物資訊學”(Bioinformatics)。
課程資訊
基本資料
選修課,學分數:3-0
上課時間:二/2,3,4[ST517]
修課班級:應數碩1,2
修課年級:年級以上
選課備註:大學部需取得授課教師同意
教師與教學助理
授課教師:謝維華
大班TA或教學助理:尚無資料
Office Hour任何時間 ST 625
授課大綱
授課大綱:開啟授課大綱(授課計畫表)
(開在新視窗)
參考書目
學術論文
開課紀錄
您可查詢過去本課程開課紀錄。 計算生物論文解析歷史開課紀錄查詢