98年第2學期-0659 應數專題-生物序列分析 課程資訊

評分方式

評分項目 配分比例 說明
期中考 50 口試。除了檢測學生對課程內容之了解程度外,口語表達能力亦為口試評分之重要依據。
期末考 50 口試。除了檢測學生對課程內容之了解程度外,口語表達能力亦為口試評分之重要依據。

選課分析

本課程名額為 70人,已有16 人選讀,尚餘名額54人。


登入後可進行最愛課程追蹤 [按此登入]。

授課教師

謝維華

教育目標

1.本課程將介紹一些重要的生物序列分析主題與方法,如教學進度表所列。 2.許多生物序列分析之方法,牽涉到機率和統計理論,如 Protein Substitution Matrices,Hidden Markov Models,BLAST 等。本課程將著重在機率建模(Probability modeling)之介紹。 3. 教學進度表中,前四週之主要內容為基本的分子生物學。於前二週加退選課程時間,將先談部份分子生物學,然後第三週開始,將直接進入教學進度表中第五週之進度。未談完之分子生物學進度,將於之後課堂中陸續介紹。亦即本課程之上課方式為雙線進行:主談生物序列分析主題與方法,交叉兼談分子生物學。而因加退選而後來選入的學生,對於本課程主談的生物序列分析主題與方法的學習,亦希望因此而較無落差。

課程概述

1.何謂 “計算生物學” (或稱生物資訊學)? DNA由a,t,c,g 4個字母組合而成,如下例即為一串DNA序列(sequence): atgcactctt caatagtttt ggccaccgtg ctctttgtag cgattgcttc agcatcaaaa acgcgagagc tatgcatgaa atcgctcgag catgccaagg ttggcaccag caaggaggcg (習慣上,每10個字母寫成一小串,小串間以一“空白”隔開。此例計有120個字母,我們稱其長度為120) 人類DNA總長為30億,這30億個字母決定了一個人。1988年開始的人類 基因計劃的主要目的,就是將這30億個字母寫出來。而這些字母是如何運作 的,則有待進一步了解。這些隱藏於字母中的生命秘密,我們稱之為生物資訊(Biological information)。 DNA會製造出蛋白質,以營造活生生的生命。蛋白質由20個英文字母 (各代表一種氨基酸)組合而成,長度從數十至數百都有,如下例即為一條蛋白質序列: mhssivlatv lfvaiasask trelcmksle hakvgtskea kqdgidlykh mfehypamkk yfkhrenytp advqkdpffi kqgqnillac hvlcatyddr etfdayvgel marherdhvk 人類約有2萬條不同的蛋白質。這些蛋白質如何營造出生命,有待進 一步了解。這些隱藏於字母中的秘密,也是所謂的生物資訊(Biological information)。 研究DNA如何運作及蛋白質如何營造生命, 也就是研究生物資訊(Biological information),是今日蓬勃發展的“生命科學”之目的。 所謂“生物序列”(Biological sequence),指的是DNA序列或蛋白質序列。 提出有效的生物序列分析方法(演算法或模型),以計算機為工具,挖掘隱藏在大量字母裡的生物資訊,我們稱之為“計算生物學”(Computational Biology),或稱之為“生物資訊學”(Bioinformatics)。 2.課程目的 由於進入計算生物學之門檻較高,而接觸此領域之最佳時機應為大學時期。本課程之目的,在讓學生對此跨領域新興學科有初步而具體之認識。因此在介紹一些基本而重要的相關演算法之同時,將於適當時機,說明DNA與蛋白質之相關知識,及所談演算法在其上之具體應用。

課程資訊

參考書目

Textbook:
An introduction to bioinformatics Algorithms
Neil C. Jones and Pavel A. Pevzner
2004, MIT



References:
1. Algorithms on strings, trees, and sequences.
Dan Gusfield
1997, Cambridge
2. Biological Sequence Analysis
R. Durbin etc.
1998 Cambridge

開課紀錄

您可查詢過去本課程開課紀錄。 應數專題-生物序列分析歷史開課紀錄查詢