99年第1學期-0657 專題:生物資訊演算法 課程資訊

iLearn 公告清單

讀取中....

Teams 連結清單

讀取中....

評分方式

評分項目 配分比例 說明
期中考 50 口試。除了檢測學生對課程內容之了解程度外,口語表達能力亦為口試評分之重要依據。
期末考 50 口試。除了檢測學生對課程內容之了解程度外,口語表達能力亦為口試評分之重要依據。

選課分析

本課程名額為 70人,已有29 人選讀,尚餘名額41人。

授課教師

謝維華

教育目標

1. 本課程之目的,在讓學生對此跨領域新興學科有初步而具體之認識。因此在介紹一些基本而重要的相關演算法之同時,將於適當時機,說明DNA與蛋白質之相關知識,及所談演算法在其上之具體應用。 2. 教學進度表中,第一週簡介 Computational complexity,之後三週所列之主要內容為基本的分子生物學。於前二週加退選課程時間,將先談部份分子生物學,然後第三週開始,將直接進入教學進度表中第五週之進度。未談完之分子生物學進度,將於之後課堂中陸續介紹。亦即本課程之上課方式為雙線進行:主談生物資訊演算法,交叉兼談分子生物學。希望能引發數學系,或其它科系的學生,對此跨領域新興學科的學習興趣;因加退選而後來選入的學生,對於本課程主談的生物資訊演算法的學習,亦希望因此而較無落差。

課程概述

何謂 “計算生物學” (或稱生物資訊學)? DNA由a,t,c,g 4個字母組合而成,如下例即為一串DNA序列(sequence): atgcactctt caatagtttt ggccaccgtg ctctttgtag cgattgcttc agcatcaaaa acgcgagagc tatgcatgaa atcgctcgag catgccaagg ttggcaccag caaggaggcg (習慣上,每10個字母寫成一小串,小串間以一“空白”隔開。此例計有120個字母,我們稱其長度為120) 人類DNA總長為30億,這30億個字母決定了一個人。1988年開始的人類基因計劃的主要目的,就是將這30億個字母寫出來。而這些字母是如何運作的,則有待進一步了解。這些隱藏於字母中的生命秘密,我們稱之為生物資訊(Biological information)。 DNA會製造出蛋白質,以營造活生生的生命。蛋白質由20個英文字母 (各代表一種氨基酸)組合而成,長度從數十至數百都有,如下例即為一條蛋白質序列: mhssivlatv lfvaiasask trelcmksle hakvgtskea kqdgidlykh mfehypamkk yfkhrenytp advqkdpffi kqgqnillac hvlcatyddr etfdayvgel marherdhvk 人類約有2萬條不同的蛋白質。這些蛋白質如何營造出生命,有待進一步了解。這些隱藏於字母中的秘密,也是所謂的生物資訊(Biological information)。 研究DNA如何運作及蛋白質如何營造生命, 也就是研究生物資訊(Biological information),是今日蓬勃發展的“生命科學”之目的。 所謂“生物序列”(Biological sequence),指的是DNA序列或蛋白質序列。 提出有效的生物序列分析方法(演算法或模型),以計算機為工具,挖掘隱藏在大量字母裡的生物資訊,我們稱之為“計算生物學”(Computational Biology),或稱之為“生物資訊學”(Bioinformatics)。

課程資訊

參考書目

Textbook:
An introduction to bioinformatics Algorithms
Neil C. Jones and Pavel A. Pevzner
2004, MIT



References:
1. Algorithms on strings, trees, and sequences.
Dan Gusfield
1997, Cambridge
2. Biological Sequence Analysis
R. Durbin etc.
1998 Cambridge
3. Computers and intractability
Michael R. Garey and David S. Johnson
1979 W.H. Freeman and company