1緒言
1.1生物資訊學的發展歷史
1.2本書內容簡介
1.3貫穿本書的例子
2序列資料資源
2.1分子生物學資料庫
2.2序列資料存儲格式
2.3核酸序列資料庫
2.3.1GenBank資料庫
2.3.2RefSeq資料庫
2.3.3EPD資料庫
2.4蛋白質序列資料庫
2.4.1UniProt簡介
2.4.2UniProtKB資料庫
2.5基因組資料資源
2.5.1基礎知識
2.5.2不同物種的基因組資料庫
2.5.3人類基因組資料庫
2.6資料的檢索與獲取
2.6.1檢索工具
2.6.2獲取序列資料的例子
思考題
3序列比對與比對搜索
3.1基本概念
3.1.1比對序列的選擇:核苷酸序列還是蛋白質序列
3.1.2同源性、相似性和一致性
3.1.3空位
3.1.4多序列比對
3.2Dayhoff模型:可接受點突變
3.2.1PAM1矩陣
3.2.2PAM250和其他PAM矩陣
3.2.3從突變概率矩陣到對數比值打分矩陣
3.2.4雙序列比對中PAM矩陣的實際有用性
3.2.5PAM矩陣的重要替代者:BLOSUM打分矩陣
3.2.6雙序列比對和檢測限度
3.3比對演算法:全局和局部
3.3.1全局序列比對:Needleman—Wunsch演算法
3.3.2局部比對:Smith—Waterman演算法
3.3.3Smith—Waterman演算法的快速和啟發式版本
3.4雙序列比對的顯著性
3.4.1雙序列比對統計顯著性檢驗
3.4.2全局比對的統計顯著性
3.4.3局部比對的統計顯著性
3.5局部比對搜索基本工具BLAST
3.5.1BLAST搜索的關鍵步驟
3.5.2BLAST演算法:列表、掃描、延伸
3.5.3BLAST演算法的統計學和E值
3.5.4BLAST的各類分值
3.5.5BLAST搜索示例:應用搜索原則
3.5.6BLAST搜索示例:多結構域蛋白的搜索
3.5.7BLAST搜索示例:改變打分矩陣
3.6尋找遠緣相關的蛋白質:PSI—BLAST
3.6.1基本步驟
3.6.2PSI—BLAST的結果評估
3.6.3PSI—BLAST的錯誤:破壞的問題
3.7模式識別BLAST(PHI—BLAST)
3.8用BLAST來發現新基因
思考題
4基因組結構注釋
4.1引言
4.1.1基因及其結構
4.1.2基因結構預測概述
4.2基於EST序列資料識別基因結構
4.2.1判別基因序列的真實EST匹配的措施
4.2.2真實EST匹配的識別流程
4.2.3確定EST對應的基因結構
4.3基因結構預測的統計學建模方法
4.3.1基於多級優化預測基因結構的基本思想
4.3.2基因結構的分級建模
4.3.3基因結構預測的動態規劃演算法
4.3.4基於統計學方法預測基因結構的效果
4.4基因組結構的自動注釋
4.4.1Ensembl的基因組注釋流程
4.4.2Ensembl自動注釋結果與人工注釋結果比較
思考題
5分子系統發生分析
5.1分子水準的進化介紹
5.1.1問題的歷史起源
5.1.2分子鐘
5.2基本概念
5.2.1系統發生樹的基本概念
5.2.2直系同源和旁系同源
5.3分子系統發生樹的構建
5.3.1選擇可供分析的序列
5.3.2多序列比對
5.3.3構建系統發生樹
5.3.4方法的選取
5.3.5常用分析軟體
思考題
6蛋白質結構
6.1蛋白質結構
6.2蛋白質結構資料庫和結構視覺化
6.2.1PDB資料庫
6.2.2蛋白質結構家族分類資料庫
6.2.3蛋白質結構的視覺化
6.3蛋白質結構分析
6.3.1蛋白質結構比對
6.3.2結構模型品質的分析
6.3.3蛋白質內部相互作用分析
6.3.4溶劑可接近表面的計算及分析
6.3.5功能位點的分析
6.4蛋白質結構預測
6.4.1蛋白質結構比較建模
6.4.2蛋白質結構從頭預測方法
6.4.3二級結構預測
6.4.4結構預測的策略
思考題
7蛋白質序列分析與功能預測
7.1引言
7.2功能描述
7.2.1基因本體
7.2.2利用GO術語的功能注釋
7.3基於序列相似性的功能預測
7.3.1基本預測方法
7.3.2分析與討論
7.3.3蛋白質家族與序列的相似性聚類
7.4基於蛋白質信號的功能預測
7.4.1蛋白質信號
7.4.2信號的描述
7.4.3蛋白質模體、結構域和家族資料庫
7.4.4分析與討論
7.5基於蛋白質序列特徵的功能預測
7.5.1序列的理化性質
7.5.2跨膜與捲曲螺旋分析
7.5.3蛋白質翻譯後修飾分析
7.5.4亞細胞定位預測
7.5.5基於序列特徵的蛋白質分子功能預測
7.6功能預測的其他思路
思考題
8微陣列資料分析
8.1微陣列
8.1.1微陣列實驗過程
8.1.2微陣列製備
8.1.3雜交方式
8.1.4圖像分析
8.1.5數據標準化
8.1.6基因表達矩陣
8.1.7基因表達資料分析
8.2數據預處理
8.2.1全局歸一化
8.2.2散點分析
8.2.3資料全局歸一化中的局部歸一化
8.3差異表達基因的檢測
8.3.1基本檢驗方法
8.3.2分析實例
8.3.3疾病基因表達譜差異分析
8.4微陣列資料的分類分析方法
8.4.1聚類分析
8.4.2分類分析
8.5構建基因調控網路
8.5.1基因調控網路的簡單例子
8.5.2微分方程模型
8.5.3布林網路模型
8.5.4貝葉斯網路模型
8.6微陣列資料與分析軟體
8.6.1資料交換標準
8.6.2微陣列資料庫
8.6.3微陣列資料分析流程
8.6.4微陣列資料分析工具
思考題
9蛋白質組資料分析
9.1二維凝膠電泳資料分析
9.1.1二維凝膠電泳原理
9.1.2二維凝膠電泳資料及其應用
9.2蛋白質質譜資料分析
9.2.1質譜技術
9.2.2蛋白質的質譜分析
9.3蛋白質互作生物資訊學
9.3.1親和層析和質譜
9.3.2酵母雙雜交系統
9.3.3蛋白質—蛋白質互作預測
9.3.4蛋白質相互作用資料庫
9.4分析細胞通路的生物資訊學方法
思考題
10疾病相關研究
10.1疾病基因相關研究的概述
10.2疾病相關的資料資源
10.2.1人類線上孟德爾遺傳資料庫
10.2.2遺傳關聯資料庫
10.2.3人類基因突變資料庫
10.2.4癌症資料庫
10.2.5單核苷酸多態性資料庫
10.3疾病基因發現
思考題
11SNP晶片及深度測序數據分析
11.1SNP簡介
11.2結構變異
11.3SNP實驗簡介
11.3.1Illumina晶片
11.3.2Affymetrix晶片
11.4深度測序技術
11.5序列資料基本格式
11.5.1FASTQ
11.5.2SAM和BAM
11.5.3BED
11.5.4VCF
11.6實例資料分析
11.6.1利用深度測序發現SNV
11.6.2利用SNP晶片檢測拷貝數變異
思考題
參考書目