生物信息學

生物信息學

《生物信息學》是由哈爾濱工業大學主辦的公開發行期刊,ISSN:1672-5565,CN:23-1513/Q,郵發代號:14-14,創刊于2003年。

  • 書名
    生物信息學
  • 作者
    霍奇曼
  • ISBN
    978703 0288738
  • 定價
    52.00元
  • 出版社
    科學出版社
  • 出版時間
    2010年9月1日
  • 開本
    16開

基本簡介

生物信息學Bioinformatics)是在生命科學的研究中,以電腦為工具對生物信息進行儲存、檢索和分析的科學。它是當今生命科學和自然科學的重大前沿領域之一,同時也將是21世紀自然科學的核心領域之一。其研究重點主要體現在基因組學(Genomics)和蛋白質組學(Proteomics)兩方面,具體說就是從核酸和蛋白質序列出發,分析序列中表達的結構功能的生物信息。

生物信息學

相關定義

定義一

生物信息學是一門收集、分析遺傳資料以及分發給研究機構的新學科(Bioinformatics is a new subject of genetic data collection,analysis and dissemination to the research community)。(林華安,Dr. Hwa A. Lim,1987)

定義二

生物信息學特指資料庫類的工作,包括持久穩固的在一個穩定的地方提供對資料的支持(Bioinformatics refers to database-like activities,involving persistent sets of data that are maintained in a consistent state over essentially indefinite periods of time)。(林華安,Dr. Hwa A. Lim,1994)

定義三

生物信息學是在大分子方面的概念型的生物學,並且使用了信息學的技術,這包括了從套用數學、電腦科學以及統計學等學科衍生而來各種方法,並以此在大尺度上來理解和組織與生物大分子相關的信息。(Luscombe,2001)

具體而言,生物信息學作為一門新的學科領域,它是把基因組DNA序列信息分析作為源頭,在獲得蛋白質編碼區的信息後進行蛋白質空間結構模擬和預測,然後依據特定蛋白質的功能進行必要的葯物設計。基因組信息學,蛋白質空間結構模擬以及葯物設計構成了生物信息學的3個重要組成部分。從生物信息學研究的具體內容上看,生物信息學應包括這3個主要部分:⑴新演算法和統計學方法研究;⑵各類資料的分析和解釋;⑶研製有效利用和管理資料新工具。

生物信息學是一門利用電腦技術研究生物系統之規律的學科。

目前的生物信息學基本上隻是分子生物學與信息技術(尤其是因特網技術)的結合體。生物信息學的研究材料和結果就是各種各樣的生物學資料,其研究工具是電腦,研究方法包括對生物學資料的搜尋(收集和篩選)、處理(編輯、整理、管理和顯示)及利用(計算、模擬)。

1990年代以來,伴隨著各種基因組測序計畫的展開和分子結構測定技術的突破和Internet的普及,數以百計的生物學資料庫如雨後春筍般迅速出現和成長。對生物信息學工作者提出了嚴峻的挑戰:數以億計的ACGT序列中包涵著什麽信息?基因組中的這些信息怎樣控製有機體的發育?基因組本身又是怎樣進化的?

生物信息學的另一個挑戰是從蛋白質的氨基酸序列預測蛋白質結構。這個難題已困擾理論生物學家達半個多世紀,如今找到問題答案要求正變得日益迫切。諾貝爾獎得主W. Gilbert在1991年曾經指出:“傳統生物學解決問題的方式是實驗的。現在,基于全部基因都將知曉,並以電子可操作的方式駐留在資料庫中,新的生物學研究模式的出發點應是理論的。一個科學家將從理論推測出發,然後再回到實驗中去,追蹤或驗證這些理論假設”。

生物信息學的主要研究方向:基因組學 - 蛋白質組學 - 系統生物學 - 比較基因組學,1989年在美國舉辦生物化學系統論與生物數學的電腦模型國際會議,生物信息學發展到了計算生物學、計算系統生物學的時代。

姑且不去引用生物信息學冗長的定義,以通俗的語言闡述其核心套用即是:隨著包括人類基因組計畫在內的生物基因組測序工程的裏程碑式的進展,由此產生的包括生物體生老病死的生物資料以前所未有的速度遞增,目前已達到每14個月翻一番的速度。同時隨著網際網路的普及,數以百計的生物學資料庫如雨後春筍般迅速出現和成長。然而這些僅僅是原始生物信息的獲取,是生物信息學產業發展的初級階段,這一階段的生物信息學企業大都以出售生物資料庫為生。以人類基因組測序而聞名的塞萊拉公司即是這一階段的成功代表。

原始的生物信息資源挖掘出來後,生命科學工作者面臨著嚴峻的挑戰:數以億計的ACGT序列中包涵著什麽信息?基因組中的這些信息怎樣控製有機體的發育?基因組本身又是怎樣進化的?生物信息學產業的高級階段體現于此,人類從此進入了以生物信息學為中心的後基因組時代。結合生物信息學的新葯創新工程即是這一階段的典型套用。

發展簡介

生物信息學是建立在分子生物學的基礎上的,因此,要了解生物信息學,就必須先對分子生物學的發展有一個簡單的了解。研究生物細胞的生物大分子的結構與功能很早就已經開始,1866年孟德爾從實驗上提出了假設:基因是以生物成分存在,1871年Miescher從死的白細胞核中分離出脫氧核糖核酸(DNA),在Avery和McCarty于1944年證明了DNA是生命器官的遺傳物質以前,人們仍然認為染色體蛋白質攜帶基因,而DNA是一個次要的角色。1944年Chargaff發現了著名的Chargaff規律,即DNA中鳥嘌呤的量與胞嘧定的量總是相等,腺嘌呤與胸腺嘧啶的量相等。與此同時,Wilkins與Franklin用X射線衍射技術測定了DNA纖維的結構。1953年James Watson 和FrancisCrick在Nature雜志上推測出DNA的三維結構(雙螺旋)。DNA以磷酸糖鏈形成發雙股螺旋,脫氧核糖上的鹼基按Chargaff規律構成雙股磷酸糖鏈之間的鹼基對。這個模型表明DNA具有自身互補的結構,根據鹼基對原則,DNA中貯存的遺傳信息可以精確地進行復製。他們的理論奠定了分子生物學的基礎。DNA雙螺旋模型已經預示出了DNA復製的規則,Kornberg于1956年從大腸桿菌(E.coli)中分離出DNA聚合酶I(DNA polymerase I),能使4種dNTP連線成DNA。DNA的復製需要一個DNA作為模板。Meselson與Stahl(1958)用實驗方法證明了DNA復製是一種半保留復製。Crick于1954年提出了遺傳信息傳遞的規律,DNA是合成RNA的模板,RNA又是合成蛋白質的模板,稱之為中心法則(Central dogma),這一中心法則對以後分子生物學和生物信息學的發展都起到了極其重要的指導作用。經過Nirenberg和Matthai(1963)的努力研究,編碼20氨基酸的遺傳密碼得到了破譯。限製性內切酶的發現和重組DNA的克隆(clone)奠定了基因工程的技術基礎。正是由于分子生物學的研究對生命科學的發展有巨大的推動作用,生物信息學的出現也就成了一種必然。2001年2月,,人類基因組工程測序的完成,使生物信息學走向了一個高潮。由于DNA自動測序技術的快速發展,DNA資料庫中的核酸序列公共資料量以每天106bp速度成長,生物信息迅速地膨脹成資料的海洋。毫無疑問,我們正從一個積累資料向解釋資料的時代轉變,資料量的巨大積累往往蘊含著潛在突破性發現的可能,"生物信息學"正是從這一前提產生的交叉學科。粗略地說,該領域的核心內容是研究如何通過對DNA序列的統計計算分析,更加深入地理解DNA序列,結構,演化及其與生物功能之間的關系,其研究課題涉及到分子生物學,分子演化及結構生物學,統計學及電腦科學等許多領域。生物信息學是內涵非常豐富的學科,其核心是基因組信息學,包括基因組信息的獲取,處理,存儲,分配和解釋。基因組信息學的關鍵是"讀懂"基因組的核苷酸順序,即全部基因在染色體上的確切位置以及各DNA片段的功能;同時在發現了新基因信息之後進行蛋白質空間結構模擬和預測,然後依據特定蛋白質的功能進行葯物設計。了解基因表達的調控機理也是生物信息學的重要內容,根據生物分子在基因調控中的作用,描述人類疾病的診斷,治療內在規律。它的研究目標是揭示"基因組信息結構的復雜性及遺傳語言的根本規律",解釋生命的遺傳語言。生物信息學已成為整個生命科學發展的重要組成部分,成為生命科學研究的前沿。

研究方向

生物信息學在短短十幾年間,已經形成了多個研究方向,以下簡要介紹一些主要的研究重點。

序列比對

序列比對(Sequence Alignment)的基本問題是比較兩個或兩個以上符號序列的相似性或不相似性。從生物學的初衷來看,這一問題包含了以下幾個意義:從相互重疊的序列片斷中重構DNA的完整序列。在各種試驗條件下從探測資料(probe data)中決定物理和基因圖存貯,遍歷和比較資料庫中的DNA序列,比較兩個或多個序列的相似性,在資料庫中搜尋相關序列和子序列,尋找核苷酸(nucleotides)的連續產生模式,找出蛋白質和DNA序列中的信息成分。序列比對考慮了DNA序列的生物學特徵,如序列局部發生的插入,移除(前兩種簡稱為indel)和替代,序列的目標函式獲得序列之間突變集最小距離加權和或最大相似性和,對齊的方法包括全局對齊,局部對齊,代溝懲罰等。兩個序列比對常採用動態規劃演算法,這種演算法在序列長度較小時適用,然而對于海量基因序列(如人的DNA序列高達10bp),這一方法就不太適用,甚至採用演算法復雜性為線性的也難以奏效。因此,啓發式方法的引入勢在必然,著名的BALST和FASTA演算法及相應的改進方法均是從此前提出發的。

比對預測

基本問題是比較兩個或兩個以上蛋白質分子空間結構的相似性或不相似性。蛋白質的結構與功能是密切相關的,一般認為,具有相似功能的蛋白質結構一般相似。蛋白質是由氨基酸組成的長鏈,長度從50到1000~3000AA(Amino Acids),蛋白質具有多種功能,如酶,物質的存貯和運輸,信號傳遞,抗體等等。氨基酸的序列內在的決定了蛋白質的3維結構。一般認為,蛋白質有四級不同的結構。研究蛋白質結構和預測的理由是:醫葯上可以理解生物的功能,尋找dockingdrugs的目標,農業上獲得更好的農作物的基因工程,工業上有利用酶的合成。直接對蛋白質結構進行比對的原因是由于蛋白質的3維結構比其一級結構在進化中更穩定的保留,同時也包含了較AA序列更多的信息。蛋白質3維結構研究的前提假設是內在的氨基酸序列與3維結構一一對應(不一定全真),物理上可用最小能量來解釋。從觀察和總結已知結構的蛋白質結構規律出發來預測未知蛋白質的結構。同源建模(homology modeling)和指認(Threading)方法屬于這一範疇。同源建模用于尋找具有高度相似性的蛋白質結構(超過30%氨基酸相同),後者則用于比較進化族中不同的蛋白質結構。然而,蛋白結構預測研究現狀還遠遠不能滿足實際需要。

分析研究

基因識別的基本問題是給定基因組序列後,正確識別基因的範圍和在基因組序列中的精確位置。非編碼區由內含子組成(introns),一般在形成蛋白質後被丟棄,但從實驗中,如果去除非編碼區,又不能完成基因的復製。顯然,DNA序列作為一種遺傳語言,既包含在編碼區,又隱含在非編碼序列中。分析非編碼區DNA序列目前沒有一般性的指導方法。在人類基因組中,並非所有的序列均被編碼,即是某種蛋白質的模板,已完成編碼部分僅佔人類基因總序列的3~5%,顯然,手工的搜尋如此大的基因序列是難以想象的.偵測密碼區的方法包括測量密碼區密碼子(codon)的頻率,一階和二階馬爾可夫鏈,ORF(Open Reading Frames),啓動子(promoter)識別,HMM(Hidden Markov Model)和GENSCAN,Splice Alignment等等。

分子進化

分子進化是利用不同物種中同一基因序列的異同來研究生物的進化,構建進化樹。既可以用DNA序列也可以用其編碼的氨基酸序列來做,甚至于可通過相關蛋白質的結構比對來研究分子進化,其前提假定是相似種族在基因上具有相似性。通過比較可以在基因組層面上發現哪些是不同種族中共同的,哪些是不同的。早期研究方法常採用外在的因素,如大小,膚色,肢體的數量等等作為進化的依據。近年來較多模式生物基因組測序任務的完成,人們可從整個基因組的角度來研究分子進化。在匹配不同種族的基因時,一般須處理三種情況:Orthologous:不同種族,相同功能的基因;Paralogous:相同種族,不同功能的基因;Xenologs:有機體間採用其他方式傳遞的基因,如被病毒註入的基因。這一領域常採用的方法是構造進化樹,通過基于特征(即DNA序列或蛋白質中的氨基酸的鹼基的特定位置)和基于距離(對齊的分數)的方法和一些傳統的聚類方法(如UPGMA)來實現。

序列重疊

根據現行的測序技術,每次反應隻能測出500 或更多一些鹼基對的序列,如人類基因的測量就採用了短槍(shortgun)方法,這就要求把大量的較短的序列全體構成了重疊群(Contigs)。逐步把它們拼接起來形成序列更長的重疊群,直至得到完整序列的過程稱為重疊群裝配。從演算法層次來看,序列的重疊群是一個NP-完全問題。

遺傳密碼

通常對遺傳密碼的研究認為,密碼子與氨基酸之間的關系是生物進化歷史上一次偶然的事件而造成的,並被固定在現代生物的共同祖先裏,一直延續至今。不同于這種"凍結"理論,有人曾分別提出過選擇最佳化,化學和歷史等三種學說來解釋遺傳密碼。隨著各種生物基因組測序任務的完成,為研究遺傳密碼的起源和檢驗上述理論的真偽提供了新的素材。

葯物設計

人類基因工程的目的之一是要了解人體內約10萬種蛋白質的結構,功能,相互作用以及與各種人類疾病之間的關系,尋求各種治療和預防方法,包括葯物治療。基于生物大分子結構及小分子結構的葯物設計是生物信息學中的極為重要的研究領域。為了抑製某些酶或蛋白質的活性,在已知其蛋白質3級結構的基礎上,可以利用分子對齊演算法,在電腦上設計抑製劑分子,作為候選葯物。這一領域目的是發現新的基因葯物,有著巨大的經濟效益。

建模仿真

隨著大規模實驗技術的發展和資料累積,從全局和系統水準研究和分析生物學系統,揭示其發展規律已經成為後基因組時代的另外一個研究 熱點-系統生物學。目前來看,其研究內容包括生物系統的模擬(Curr Opin Rheumatol,2007,463-70),系統穩定性分析(Nonlinear Dynamics Psychol Life Sci,2007,413-33),系統魯棒性分析(Ernst Schering Res Found Workshop, 2007,69-88)等方面。以SBML(Bioinformatics,2007,1297-8)為代表的建模語言在迅速發展之中,以布爾網路 (PLoS Comput Biol,2007,e163)、微分方程(Mol Biol Cell,2004,3841-62)、隨機過程(Neural Comput,2007,3262-92)、離散動態事件系統等(Bioinformatics,2007,336-43)方法在系統分析中已經得到應 用。很多模型的建立借鏡了電路和其它物理系統建模的方法,很多研究嘗試從信息流、熵和能量流等巨觀分析思想來解決系統的復雜性問題(Anal Quant Cytol Histol,2007,296-308)。當然,建立生物系統的理論模型還需要很長時間的努力,現在實驗觀測資料雖然在海量增加,但是生物系統的模型辨 識所需要的資料遠遠超過了目前資料的產出能力。例如,對于時間序列的晶片資料,採樣點的數量還不足以使用傳統的時間序列建模方法,巨大的實驗代價是目前系 統建模主要困難。系統描述和建模方法也需要開創性的發展。

技術方法

生物信息學不僅僅是生物學知識的簡單整理和數學、物理學、信息科學等學科知識的簡單套用。海量資料和復雜的背景導致機器學習、統 計資料分析和系統描述等方法需要在生物信息學所面臨的背景之中迅速發展。巨大的計算量、復雜的噪聲模式、海量的時變資料給傳統的統計分析帶來了巨大的困難, 需要像非參數統計(BMC Bioinformatics,2007,339)、聚類分析(Qual Life Res,2007,1655-63)等更加靈活的資料分析技術。高維資料的分析需要偏最小二乘(partial least squares,PLS)等特征空間的壓縮技術。在電腦演算法的開發中,需要充分考慮演算法的時間和空間復雜度,使用並行計算、格線計算等技術來拓展演算法的 可實現性。

生物圖像

沒有血緣關系的人,為什麽長得那麽像呢?

外貌是像點組成的,像點愈重合兩人長得愈像,那兩個沒有血緣關系的人像點為什麽重合?

有什麽生物學基礎?基因是不是相似?我不知道,希望專家解答。

其他介紹

如基因表達譜分析,代謝網路分析;基因晶片設計和蛋白質組學資料分析等,逐漸成為生物信息學中新興的重要研究領域;在學科方面,由生物信息學衍生的學科包括結構基因組學,功能基因組學,比較基因組學,蛋白質學,葯物基因組學,中葯基因組學,腫瘤基因組學,分子流行病學和環境基因組學,成為系統生物學的重要研究方法。從現在的發展不難看出,基因工程已經進入了後基因組時代。我們也有應對與生物信息學密切相關的如機器學習,和數學中可能存在的誤導有一個清楚的認識。

研究方法

以資料(庫)為核心

1 資料庫的建立

2 生物學資料的檢索

3 生物學資料的處理

4 生物學資料的利用:計算生物學

其他資料

生物信息學與機器學習

生物信息的大規模給資料挖掘提出了新課題和挑戰,需要新的思想的加入.常規的電腦演算法仍可以套用于生物資料分析中,但越來越不適用于序列分析問題.究其原因,是由于生物系統本質上的模型復雜性及缺乏在分子層上建立的完備的生命組織理論.西蒙曾給出學習的定義:學習是系統的變化,這種變化可使系統做相同工作時更有效。機器學習的目的是期望能從資料中自動地獲得相應的理論,通過採用如推理,模型擬合及從樣本中學習,尤其適用于缺乏一般性的理論,"噪聲"模式,及大規模資料集.因此,機器學習形成了與常規方法互補的可行的方法.機器學習使得利用電腦從海量的生物信息中提取有用知識,發現知識成為可能.機器學習方法在大樣本,多向量的資料分析工作中發揮著日益重要的作用,而目前大量的基因資料庫處理需要電腦能自動識別,標註,以避免即耗時又花費巨大的人工處理方法.早期的科學方法——觀測和假設——面對高資料的體積,快速的資料獲取率和客觀分析的要求——已經不能僅依賴于人的感知來處理了.因而,生物信息學與機器學習相結合也就成了必然.機器學習中最基本的理論架構是建立在概率基礎上的,從某種意義來說,是統計模型擬合的延續,其目的均為提取有用信息.機器學習與模式識別和統計推理密切相關.學習方法包括資料聚類,神經網路分類器和非線性回歸等等.隱馬爾可夫模型也廣泛用于預測DNA的基因結構.目前研究重心包括:1)觀測和探索有趣的現象.目前ML研究的焦點是如何可視化和探索高維向量資料.一般的方法是將其約簡至低維空間,如常規的主成分分析(PCA),核主成分分析(KPCA),獨立成分分析(Independent component analysis),局部線性嵌套(LocallyLinear embedding).2)生成假設和形式化模型來解釋現象[6].大多數聚類方法可看成是擬合向量資料至某種簡單分布的混合.在生物信息學中聚類方法已經用于microarray資料分析中,癌症類型分類及其他方向中.機器學習也用于從基因資料庫中獲得相應的現象解釋.機器學習加速了生物信息學的進展,也帶了相應的問題.機器學習方法大多假定資料符合某種相對固定的模型,而一般資料結構通常是可變的,在生物信息學中尤其如此,因此,有必要建立一套不依賴于假定資料結構的一般性方法來尋找資料集的內在結構.其次,機器學習方法中常採用"黑箱"操作,如神經網路和隱馬爾可夫模型,對于獲得特定解的內在機理仍不清楚.

數學問題

生物信息學中數學佔了很大的比重.統計學,包括多元統計學,是生物信息學的數學基礎之一;概率論與隨機過程理論,如近年來興起的隱馬爾科夫鏈模型(HMM),在生物信息學中有重要套用;其他如用于序列比對的運籌學;蛋白質空間結構預測和分子對接研究中採用的最最佳化理論;研究DNA超螺旋結構的拓撲學;研究遺傳密碼和DNA序列的對稱性方面的群論等等.總之,各種數學理論或多或少在生物學研究中起到了相應的作用.但並非所有的數學方法在引入生物信息學中都能普遍成立的,以下以統計學和度量空間為例來說明.

統計學的悖論

數學的發展是伴隨悖論而發展的.對于進化樹研究和聚類研究中最顯著的悖論莫過于均值了,就說明了要採用常規的均值方法不能將這兩類分開,也表明均值並不能帶來更多的資料的幾何性質.那麽,如果資料呈現類似的特有分布時,常有的進化樹演算法和聚類演算法(如K-均值)往往會得錯誤的結論.統計上存在的陷阱往往是由于對資料的結構缺乏一般性認識而產生的.

度量空間的假設

在生物信息學中,進化樹的確立,基因的聚類等都需要引入度量的概念.舉例來說,距離上相近或具有相似性的基因等具有相同的功能,在進化樹中滿足分值最小的具有相同的父系,這一度量空間的前提假設是度量在全局意義下成立.那麽,是否這種前提假設具有普適性呢,我們不妨給出一般的描述:假定兩個向量為A,B,其中,則在假定且滿足維數間線性無關的前提下,兩個向量的度量可定義為:⑴依據上式可以得到滿足正交不變運動群的歐氏度量空間,這也是大多數生物信息學中常採用的一般性描述,即假定了變數間線性無關.然而,這種假設一般不能正確描述度量的性質,尤其在高維資料集時,不考慮資料變數間的非線性相關性顯然存在問題,由此,我們可以認為,一個正確的度量公式可由下式給出:⑵上式中採用了愛因斯坦和式約定,描述了變數間的度量關系.後者在滿足⑶時等價于⑴,因而是更一般的描述,然而問題在于如何準確描述變數間的非線性相關性,我們正在研究這個問題.

統計學習理論在生物信息學中套用的困難

生物信息學中面對的資料量和資料庫都是規模很大的,而相對的目標函式卻一般難以給出明確的定義.生物信息學面臨的這種困難,可以描述成問題規模的巨大以及問題定義的病態性之間的矛盾,一般從數學上來看,引入某個正則項來改善性能是必然的[7].以下對基于這一思想產生的統計學習理論,Kolmogorov復雜性[98]和BIC(Bayesian Information Criterion)[109]及其存在的問題給出簡要介紹.支持向量機(SVM)是近來較熱門的一種方法,其研究背景是Vapnik的統計學習理論,是通過最大化兩個資料集的最小間隔來實現分類,對于非線性問題則採用核函式將資料集對應至高維空間而又無需顯式描述資料集在高維空間的性質,這一方法較之神經方法的好處在于將神經網路隱層的參數選擇簡化為對核函式的選擇,因此,受到廣泛的註意.在生物信息學中也開始受到重視,然而,核函式的選擇問題本身是一個相當困難的問題,從這個層次來看,最優核函式的選擇可能隻是一種理想,SVM也有可能象神經網路一樣隻是機器學習研究進程中又一個大氣泡.Kolmogorov復雜性思想與統計學習理論思想分別從不同的角度描述了學習的性質,前者從編碼的角度,後者基于有限樣本來獲得一致收斂性.Kolmogorov復雜性是不可計算的,因此由此衍生了MDL原則(最小描述長度),其最初隻適用于離散資料,最近已經推廣至連續資料集中,嘗試從編碼角度獲得對模型參數的最小描述.其缺陷在于建模的復雜性過高,導致在大資料集中難以運用.BIC準則從模型復雜性角度來考慮,BIC準則對模型復雜度較高的給予大的懲罰,反之,懲罰則小,隱式地體現了奧卡姆剃刀("Occam Razor")原理,近年也廣泛套用于生物信息學中.BIC準則的主要局限是對參數模型的假定和先驗的選擇的敏感性,在資料量較大時處理較慢.因此,在這一方面仍然有許多探索的空間.

討論與總結

人類對基因的認識,從以往的對單個基因的了解,上升到在整個基因組水準上考察基因的組織結構和信息結構,考察基因之間在位置,結構和功能上的相互關系.這就要求生物信息學在一些基本的思路上要做本質的觀念轉變,本節就這些問題做出探討和思索.

啓發式方法

Simond在人類的認知一書中指出,人在解決問題時,一般並不去尋找最優的方法,而隻要求找到一個滿意的方法.因為即使是解決最簡單的問題,要想得到次數最少,效能最高的解決方法也是非常困難的.最優方法和滿意方法之間的困難程度相差很大,後者不依賴于問題的空間,不需要進行全部搜尋,而隻要能達到解決的程度就可以了.正如前所述,面對大規模的序列和蛋白質結構資料集,要獲得全局結果,往往是即使演算法復雜度為線性時也不能夠得到好的結果,因此,要通過變換解空間或不依賴于問題的解空間獲得滿意解,生物信息學仍需要人工智慧和認知科學對人腦的進一步認識,並從中得到更好的啓發式方法.

問題規模不同的處理:Marvin Minsky在人工智慧研究中曾指出:小規模資料量的處理向大規模資料量推廣時,往往並非演算法上的改進能做到的,更多的是要做本質性的變化.這好比一個人爬樹,每天都可以爬高一些,但要想爬到月球,就必須採用其他方法一樣.在分子生物學中,傳統的實驗方法已不適應處理飛速成長的海量資料.同樣,在採用電腦處理上,也並非依靠原有的電腦演算法就能夠解決現有的資料挖掘問題.如在序列對齊(sequence Alignment)問題上,在小規模資料中可以採用動態規劃,而在大規模序列對齊時不得不引入啓發式方法,如BLAST,FASTA.

樂觀中的隱擾

生物信息學是一門新興學科,起步于20世紀90年代,至今已進入"後基因組時代",目前在這一領域的研究人員均呈普遍樂觀態度,那麽,是否存在潛在的隱擾呢不妨回顧一下早期人工智慧的發展史,在1960年左右,西蒙曾相信不出十年,人類即可象完成登月一樣完成對人的模擬,造出一個與人智慧型行為完全相同的機器人.而至今為止,這一諾言仍然遙遙無期.盡管人工智慧研究得到的成果已經滲入到各個領域,但對人的思維行為的了解遠未完全明了.從本質來看,這是由于最初人工智慧研究上定位錯誤以及沒有從認識論角度看清人工智慧的本質造成的;從研究角度來看,將智慧型行為還原成一般的形式化語言和規則並不能完整描述人的行為,期望物理科學的成功同樣在人工智慧研究中適用並不現實.反觀生物信息學,其目的是期望從基因序列上解開一切生物的基本奧秘,從結構上獲得生命的生理機製,這從哲學上來看是期望從分子層次上解釋人類的所有行為和功能和致病原因.這類似于人工智慧早期發展中表現的樂觀行為,也來自于早期分子生物學,生物物理和生物化學的成就.然而,從本質上來講,與人工智慧研究相似,都是希望將生命的奧秘還原成孤立的基因序列或單個蛋白質的功能,而很少強調基因序列或蛋白質組作為一個整體在生命體中的調控作用.我們因此也不得不思考,這種研究的最終結果是否能夠支撐我們對生物信息學的樂觀呢 現在說肯定的話也許為時尚早.

總結

綜上所述,不難看出,生物信息學並不是一個足以樂觀的領域,究竟原因,是由于其是基于分子生物學與多種學科交叉而成的新學科,現有的情勢仍表現為各種學科的簡單堆砌,相互之間的聯系並不是特別的緊密。在處理大規模資料方面,沒有行之有效的一般性方法;而對于大規模資料內在的生成機製也沒有完全明了,這使得生物信息學的研究短期內很難有突破性的結果。那麽,要得到真正的解決,最終不能從電腦科學得到,真正地解決可能還是得從生物學自身,從數學上的新思路來獲得本質性的動力。毫無疑問,正如Dulbecco1986年所說:"人類的DNA序列是人類的真諦,這個世界上發生的一切事情,都與這一序列息息相關"。但要完全破譯這一序列以及相關的內容,我們還有相當長的路要走。

經典教材

書名:生物信息學

生物信息學

作者:霍奇曼(T.CharlieHodgman)

出版社:科學出版社

出版時間:2010年9月1日

ISBN:9787030288738

開本:16開

定價:52.00元

內容簡介

“精要速覽系列(Instant Notes Series)”叢書是國外教材“Best Sellei-”榜的上榜教材。該系列教材結構新穎,視角獨特;重點明確,脈絡分明;圖表簡明清晰;英文自然易懂,被許多高等院校雙語教學選用。

《生物信息學(第2版)(導讀版)》在前版基礎上修訂,涵蓋了生物信息學的基本內容及拓展知識。全書共分三大部分:學科概況(A-B)、基礎部分(C-I)、套用領域(J-R),合計18章:A生物學研究方式的轉變、B生物信息學的定義、C物理學要素、D資料及資料庫、E資料類型、F計算、G概率與統計、H模擬與數學技術、1人工智慧和機器學習、J基因組及其他序列、K轉錄物組學、L蛋白質與蛋白質組學技術、M代謝物組學、N超分子結構、0生化動力學、P生理學、Q圖像分析、R文本分析。書前附有縮略詞表,書後附有進一步閱讀的文獻以及索引。

《生物信息學(第2版)(導讀版)》適合普通高校生命科學、醫葯科技相關專業,以及數學、物理、化學、電腦等理工科專業教學使用,也可供科研人員參考閱讀。

作者簡介

作者:(英國)霍奇曼(T.Charlie Hodgman) Andrew French David R.Westhead

圖書目錄

前言

縮略詞

A 生物學研究方式的轉變

B 生物信息學的定義

C 物理學要素

D 資料及資料庫

E 資料類型:

E1 資料類型

E2 生物信息學中資料表達的最佳方法

F 計算

G 概率與統計

G1 概率和概率分布

G2 條件概率和貝葉斯法則

G3 基本的統計學檢驗

H 模型與數學技術

H1 系統特征

H2 圖論及其套用

H3 常微分方程和代數學

H4 高級模擬技術

H5 形狀、變形和生長

1 人工智慧和機器學習

1 人工智慧和機器學習的概論

12 人工智慧和機器學習的統計學方法

13 人工智慧和機器學習的計算方法

J 基因組及其他序列

J1 資料庫和資料源

J2 基因組注解

J3 序列分析

J4 序列家族、聯配和系統發育

J5 結構域家族和資料庫

K 轉錄物組學

K1 轉錄譜

K2 轉錄分析的統計問題

K3 基因表達的差異分析

K4 多元技術和網路推理

K5 資料標準和實驗設計

L 蛋白質與蛋白質組學技術

L1 蛋白質組學技術

L2 相互作用蛋白質組學

L3 相互作用資料庫和網路

L4 結構生物信息學

L5 結構分類

L6 結構預測和模建

L7 分子動力學和葯物設計

M 代謝物組學

N 超分子結構

N1 超分子結構

N2 組織和生物體尺度結構

O 生化動力學

01 新陳代謝網路的研究

02 微積分和代數學的套用

P 生理學

P1 生理學

P2 整合生物學和植物模型

P3 整合生物學——結束語

Q 圖像分析

Q1 什麽是圖像分析

Q2 什麽是生物科學研究中的圖像分析

Q3 圖像增強

Q4 特征檢測

Q5 資料析取

R 文本分析

進一步閱讀的文獻

索引

相關圖書信息

書名:生物信息學——基礎與臨床醫學套用指南

ISBN:703015127

作者:伍欣星/趙旻

出版社:科學出版社

定價:30

頁數:254

出版日期:2005-3-1

版次:1

開本:16開

包裝:平裝

簡介:本書較為詳盡地介紹了生物信息學在醫學科研和臨床套用中的最新信息及資料。全書分為上下兩篇,共十四章,通過大量的實例,系統介紹了生物信息學的一些基本知識,以及生物信息學在功能基因組學研究中的套用,這些內容對于醫學科研的設計和實施將極具指導意義。

本書對分子生物學以及信息學的一些名詞給出了中英文對照和必要的解釋,列出了一些常用的生物信息相關網站,更加方便了讀者的使用。

本書既可作為生物信息學課程的教材,也是一本實用性很強的生物信息學參考書。

目錄:

上篇 生物信息學基礎

第一章 生物信息學概述

⒈1 生物信息學的定義和研究範疇

⒈1.1 生物信息學的定義

⒈1.2 生物信息學中的資料庫與網路

⒈1.3 生物信息學的主要研究範疇

⒈2 生物信息學的建立與發展

⒈3 醫學生物信息學的發展與展望

⒈3.1 醫學生物信息學的主要研究內容

⒈3.2 生物信息學的發展和展望

第二章 醫學生物信息資料庫

⒉1 醫學生物信息資料庫簡介

⒉2 國外常用醫學文獻資料庫

⒉2.1 PubMed文獻資料庫

⒉2.2 HighWire Press電子期刊資料庫

⒉3 國內常用生物醫學文獻檢索資料庫

⒉3.1 萬方資料資源系統

⒉3.2 中國期刊網

第三章 核酸資料庫的套用

⒊1 常用的DNA資料庫及軟體

⒊1.1 GenBank--NCBI核酸序列資料庫

⒊1.2 EMBL--歐洲核酸序列資料庫

⒊1.3 DDBJ--日本DNA資料庫

⒊2 常用的RNA資料庫及軟體

⒊2.1 Transterm--mRNA序列和翻譯調控元件資料庫

⒊2.2 RDP-Ⅱ--核糖體資料庫

⒊2.3 RNA二級結構預測

⒊3 核酸同源性序列比對的策略和方法

⒊3.1 資料庫中的相似性搜尋

⒊3.2 BLAST簡介

⒊3.3 BLAST套用舉例

⒊4 新序列的提交

第四章 人類基因組變異資料庫

⒋1 SNP資料庫

⒋1.1 dbSNP資料庫

⒋1.2 人類基因組變異資料庫

⒋2 突變資料庫

⒋3 基因標記物與微衛星資料庫

⒋4 觀察SNP和突變的工具

⒋4.1 在基因組水準上觀察SNP和突變的工具

⒋4.2 在基因水準上觀察SNP和突變的工具

第五章 蛋白質資源資料庫

⒌1 SWISS-PORT蛋白序列資料庫

⒌1.1 SWISS-PORT蛋白序列資料庫區別于其他蛋白序列資料庫的優點

⒌1.2 SWISS-PROT資料庫的結構與級別

⒌1.3 序列條目的結構

⒌1.4 不同的行類型

⒌1.5 資料庫的檢索

⒌2 ASTRAL--蛋白質結構和序列分析體系

第六章 生物晶片

⒍1 概述

⒍1.1 生物晶片簡介

⒍1.2 生物晶片分類

⒍1.3 幾種常見的生物晶片

⒍2 基因晶片基本原理和基本流程

⒍2.1 基因晶片的基本原理

⒍2.2 基因晶片的基本流程

⒍3 幾種新型的晶片技術

⒍4 生物晶片的套用

⒍5 生物信息學中的新技術

附 基因晶片進行基因差異表達實際操作舉例

第七章 疾病相關資料庫

⒎1 綜合臨床資料庫

⒎2 腫瘤相關資料庫

⒎2.1 腫瘤網

⒎2.2 Oncolink

⒎2.3 癌症基因組剖析計畫(CGAP)

⒎2.4 中國癌症網

⒎3 心血管疾病相關資料庫

⒎3.1 心血管疾病相關醫學資料庫(Cardio)

⒎3.2 中華心血管醫學網

⒎4 遺傳性疾病資料庫

⒎5 感染性疾病資料庫

第八章 生物信息學與葯物設計

⒏1 概述

⒏2 生物信息學在葯物設計中的優勢

⒏3 生物信息學在葯物設計環節中的套用

⒏3.1 初始階段:事半功倍的效果

⒏3.2 生物活性篩選階段:提高篩選命中率

⒏3.3 葯物開發階段:聯系遺傳信息與葯物療效的橋梁

⒏4 葯物設計過程中生物信息學套用流程

⒏4.1 綜合分子生物學方法

⒏4.2 EST資料庫搜尋

⒏4.3 結構生物學方法

⒏5 生物信息學在葯物設計中的其他套用

⒏5.1 葯物作用的機製

⒏5.2 葯物的葯代動力學及毒理性質的研究

⒏5.3 電腦輔助葯物設計

⒏6 後基因組時代葯物研究的新進展和新趨勢

附 葯物設計實例

第九章 常用軟體介紹

⒐1 Omiga介紹

⒐2 Antheprot介紹

⒐3 MACAW介紹

⒐4 Primer Premier介紹

⒐5 Reference Manager介紹

⒐6 常用限製酶分析與質粒作圖軟體

⒐6.1 Gene Construction Kit 2.5

⒐6.2 Clone Manager 7

⒐7 RNA二級結構預測及分析軟體

⒐7.1 RNAdraw 1.1b

⒐7.2 RNA Structure 3.2

⒐8 序列綜合分析軟體

第十章 基因晶片微陣列資料分析

⒑1 常用基因晶片及其資料簡介

⒑2 基因晶片資料處理與分析

⒑3 基因晶片資料分析的基本策略與方法

⒑4 基因微陣列資料分析中的常用軟體

⒑4.1 Excel

⒑4.2 SAM

⒑4.3 R及其在基因表達資料分析中的套用

下篇 生物信息學與功能基因組學互動平台

第十一章 生物信息學與基因組學技術

⒒1 新基因分析的生物信息學策略

⒒2 新基因的分離——cDNA末端快速擴增技術

⒒3 基因突變檢測(分析)技術

⒒4 mRNA差異顯示技術

⒒5 比較基因組雜交技術

⒒6 微陣列-比較基因組雜交技術

⒒7 基因表達分析技術

⒒8 SNPs、ESTs在研究新(未知)基因中的套用

第十二章 RNA組學及常用研究技術

⒓1 反義核酸技術

⒓2 核酶技術

⒓3 RNA錯折疊技術

⒓4 RNA幹擾技術

第十三章 模式生物體研究

⒔1 轉基因動物

⒔1.1 轉基因動物概念

⒔1.2 基本原理

⒔1.3 嵌合體動物

⒔1.4 轉基因動物模型在醫學研究中的套用

⒔2 基因打靶技術

⒔2.1 基因打靶技術的原理

⒔2.2 基因打靶的操作要點

⒔2.3 提高基因打靶效率的途徑

⒔2.4 基因打靶技術的套用

⒔3 時空可調節性基因打靶技術與基因陷阱

⒔3.1 時空可調節性基因打靶

⒔3.2 基因陷阱

⒔3.3 誘變技術在功能基因組學中的套用

第十四章 蛋白質組學技術

⒕1 蛋白質組分離技術

⒕1.1 二維聚丙烯酰胺凝膠電泳

⒕1.2 高效液相色譜(HPLC)

⒕1.3 毛細管電泳及電色譜(CE/CEC)

⒕2 鑒定技術

⒕2.1 質譜技術

⒕2.2 圖像分析技術

⒕.2.3 高流通量篩選(HTS)

⒕3 蛋白質晶片技術

⒕4 酵母雙雜交系統

附錄 生物信息學及分子生物學術語

相關圖書信息

書名:生物信息學

書號:9787302177937

作者:許忠能等

定價:59元

生物信息學

出版日期:2008-9-1

出版社:清華大學出版社

內容簡介

生物信息學是一門新興的交叉科學。本書共分16章,詳細介紹了生物信息學的定義、研究內容、生物學基礎、資料庫網路基礎、演算法與數學基礎以及其在序列拼接、基因預測、引物設計、生物進化與分子發育分析、蛋白質結構預測、RNA結構預測、生物晶片、電腦輔助葯物設計、生物分子網路與生物系統仿真、DNA計算中的套用與發展狀況等內容。

本書結構清晰,系統完整,文筆流暢,既可作為高等院校相關專業師生的教材,也可作為該領域中研究、教學、軟體開發等科研人員的參考用書。

目錄

第1章生物信息學概述

⒈1背景與定義

⒈1.1生物學原始資料量的急劇擴增

⒈1.2名詞“bioinformatics”的第一次出現

⒈1.3定義

⒈2研究內容

⒈2.1生物信息的存儲與獲取

⒈2.2序列比對

⒈2.3測序與拼接

⒈2.4基因預測

⒈2.5生物進化與系統發育分析

⒈2.6蛋白質結構預測

⒈2.7RNA結構預測

⒈2.8分子設計及葯物設計

⒈2.9代謝網路分析

⒈2.10生物晶片

⒈2.11DNA計算

⒈3資料庫、軟體、科研教育機構

⒈3.1資料庫

⒈3.2軟體

⒈3.3科研教育機構

⒈4期刊與著作

⒈4.1期刊

⒈4.2著作

⒈5生物學、電腦技術與數學基礎

⒈5.1生物學

⒈5.2電腦技術

⒈5.3數學

⒈6展望

⒈6.1研究內容的展望

⒈6.2套用領域的拓展

⒈6.3研究者的回報

可免費登錄的相關網站

習題

參考文獻

第2章生物信息學的生物學基礎

⒉1生物學研究的層次

⒉1.1宇宙生命的研究目錄生物信息學

⒉1.2生物與環境的關系

⒉1.3生物種類

⒉1.4生理

⒉1.5細胞

⒉1.6生物分子

⒉1.7生物進化

⒉2分子生物學基礎

⒉2.1核酸的結構

⒉2.2蛋白質的結構

⒉2.3DNA的復製

⒉2.4基因的轉錄

⒉2.5蛋白質的生物合成

⒉3人類基因組計畫

⒉3.1目標與意義

⒉3.2資助

⒉3.3研究機構

⒉3.4研究方法

⒉3.5目前結果

可免費登錄的相關網站

習題

參考文獻

第3章資料庫與網路基礎

⒊1資料庫技術基礎

⒊1.1資料庫的基本概念

⒊1.2資料庫的體系結構和資料獨立性

⒊1.3關系資料庫系統

⒊1.4生物資料處理常用的資料庫系統

⒊2網路技術簡介

⒊2.1網路基礎知識

⒊2.2Internet及其套用

⒊2.3基于Web的資料庫系統

⒊2.4基于網路的搜尋引擎

可免費登錄的相關網站

習題

參考文獻

第4章UNⅨ作業系統與電腦語言

⒋1UNⅨ作業系統

⒋1.1UNⅨ歷史

⒋1.2UNⅨ系統的特點

⒋1.3Redhat Linux 9的安裝

⒋1.4UNⅨ的基本使用

⒋1.5大型套用軟體

⒋2電腦語言

⒋2.1Perl語言簡介

⒋2.2Java語言簡介

可免費登錄的相關網站

習題

參考文獻

第5章演算法與數學基礎

⒌1演算法

⒌2圖論

⒌2.1圖

⒌2.2尋找最短路

⒌2.3歐拉圖與哈密頓圖

⒌2.4樹

⒌2.5圖論在生物信息學中的套用

⒌3動態規劃

⒌4貝葉斯統計

⒌4.1經典統計學的幾個概念

⒌4.2經典統計與貝葉斯統計的差異

⒌4.3貝葉斯定理

⒌4.4貝葉斯統計在生物信息學中的套用

⒌5馬爾可夫模型

⒌5.1概念

⒌5.2轉移概率

⒌5.3演算法過程

⒌5.4馬爾可夫模型在生物信息學中的套用

⒌6隱馬爾可夫模型

⒌6.1概念

⒌6.2演算法過程

⒌6.3隱馬爾可夫模型三個問題的研究

⒌6.4隱馬爾可夫模型在生物信息學中的套用

⒌7神經網路模型

⒌7.1神經網路的分類

⒌7.2神經網路的學習方法

⒌7.3神經網路模型在生物信息學中的套用

⒌8遺傳演算法

⒌8.1概念

⒌8.2遺傳演算法運算過程

⒌8.3遺傳演算法在生物信息學中的套用

⒌9聚類分析

⒌9.1相似性測度及聚類準則

⒌9.2聚類演算法

⒌9.3聚類分析在生物信息學中的套用

⒌10其他套用于生物信息學中的演算法

⒌11生物信息學中演算法的發展

可免費登錄的相關網站

習題

參考文獻

第6章序列比對

⒍1序列比對的概念

⒍2序列比對的意義

⒍3全局比對與局部比對

⒍3.1全局比對

⒍3.2局部比對

⒍4計分方法

⒍4.1匹配計分

⒍4.2結構與性質的計分

⒍4.3可觀測變換計分

⒍4.4空格罰分

⒍5比對的演算法過程

⒍5.1兩個序列比對

⒍5.2多序列比對

⒍6比對軟體的使用

⒍6.1用比對軟體進行兩序列比對

⒍6.2用比對軟體進行多序列比對

⒍7電腦語言編寫程式進行序列比對

可免費登錄的相關網站

習題

參考文獻

第7章序列拼接

⒎1霰彈法測序的DNA序列拼接

⒎1.1霰彈法測序原理

⒎1.2霰彈法測序拼接的計算模型

⒎2雜交測序法的DNA序列拼接

⒎2.1雜交測序法原理

⒎2.2雜交法測序拼接的計算模型

可免費登錄的相關網站

習題

參考文獻

第8章生物信息資料庫的查詢與搜尋

⒏1生物信息資料庫

⒏1.1核酸序列資料庫

⒏1.2蛋白質序列資料庫

⒏1.3結構資料庫

⒏1.4基因組資料庫

⒏1.5蛋白組資料庫

⒏1.6代謝組資料庫

⒏1.7疾病資料庫

⒏1.8葯物與分子設計資料庫

⒏1.9分析與記錄方式資料庫

⒏2生物信息資料庫的字元匹配查詢

⒏2.1查詢系統SRS

⒏2.2查詢系統Entrez

⒏3生物信息資料庫的相似性搜尋

⒏3.1BLAST

⒏3.2FASTA

可免費登錄的相關網站

習題

參考文獻

第9章生物進化與分子系統發育分析

⒐1生物進化

⒐1.1進化理論的歷史

⒐1.2進化與自然選擇的證據

⒐1.3分子進化

⒐1.4生物進化與生物信息學的關系

⒐2分子系統發育分析

⒐2.1分子系統發育分析的概念

⒐2.2構建進化樹的方法

⒐2.3用網上軟體構建進化樹

可免費登錄的相關網站

習題

參考文獻

第10章基因預測與引物設計

⒑1基因特征

⒑1.1原核生物的基因特征

⒑1.2真核生物的基因特征

⒑2基于EST的基因鑒定

⒑2.1EST概念

⒑2.2EST的獲得

⒑2.3EST與基因識別

⒑2.4EST的其他用途

⒑2.5EST資料的不足

⒑3基因預測的演算法

⒑3.1相似性比較預測

⒑3.2隱馬爾可夫模型

⒑3.3神經網路方法

⒑3.4密碼學方法

⒑3.5Z?曲線法

⒑3.6其他演算法

⒑4引物設計

⒑4.1上、下遊引物的3′末端與5′末端

⒑4.2引物分子內不互補

⒑4.3引物的長度、組分與解鏈溫度

⒑5網上的基因預測軟體

可免費登錄的相關網站

習題

參考文獻

第11章蛋白質結構及其預測

⒒1蛋白質的結構及其實驗測定方法

⒒1.1蛋白質的結構概述

⒒1.2維系蛋白質結構的作用力

⒒1.3蛋白質結構的顯示軟體

⒒1.4蛋白質結構的實驗測定方法

⒒2蛋白質分類

⒒2.1按序列特征分類

⒒2.2按在生物體中的位置分類

⒒2.3按折疊類型分類

⒒3蛋白質結構預測演算法

⒒3.1特殊序列預測

⒒3.2蛋白質二級結構的預測

⒒3.3蛋白質三級結構的預測

⒒4蛋白質結構預測軟體

⒒4.1蛋白質二級結構預測軟體

⒒4.2蛋白質三級結構預測軟體

⒒5編寫電腦程式進行蛋白質二級結構預測

可免費登錄的相關網站

習題

參考文獻

第12章RNA結構與預測

⒓1RNA的發現及其功能研究

⒓2RNA的結構特征及其與功能的關系

⒓2.1RNA的結構層次

⒓2.2核糖體RNA的結構

⒓2.3tRNA的結構

⒓2.4mRNA的結構與功能

⒓2.5核酶的結構與功能

⒓2.6形成RNA特定結構的序列特征

⒓3RNA二級結構的預測演算法

⒓3.1比較序列分析方法

⒓3.2動態規劃演算法

⒓3.3對RNA結構預測演算法的評價

⒓4網上RNA二級結構分析軟體

可免費登錄的相關網站

習題

參考文獻

第13章生物晶片

⒔1引言

⒔2生物晶片的原理

⒔2.1生物晶片的製備

⒔2.2待檢生物樣品製備和標記

⒔2.3生物分子之間的結合

⒔2.4檢測原理

⒔3資料分析

⒔3.1圖像分析

⒔3.2標準化處理(normalization)

⒔3.3Ratio分析(ratio analysis)

⒔3.4聚類分析(clustering analysis)

⒔3.5基因表達資料庫

⒔4其他生物晶片技術

⒔4.1微流路晶片

⒔4.2活體化晶片

⒔4.3晶片實驗室(lab on a chip)

可免費登錄的相關網站

習題

參考文獻

第14章電腦輔助葯物設計

⒕1電腦輔助葯物設計的概念

⒕2葯物設計的理論基礎

⒕2.1受體與配體

⒕2.2理論計算方法

⒕3結合自由能的計算

⒕3.1自由能微擾/熱力學積分方法

⒕3.2線性相互作用能方法

⒕3.3打分函式

⒕4基于配體的葯物設計

⒕4.1定量構效關系方法

⒕4.2葯效團模型方法

⒕5基于受體的葯物設計

⒕5.1重新配體設計

⒕5.2分子對接虛擬篩選

⒕5.3生物大分子模建和葯物設計集成軟體包——InsightⅡ

⒕6葯物發現集成平台

可免費登錄的相關網站

習題

參考文獻

第15章生物分子網路與生物系統仿真

⒖1生物分子網路

⒖1.1生物分子網路的特征與研究方法

⒖1.2代謝網路

⒖1.3基因調控網路

⒖1.4蛋白質相互作用網路

⒖2生物系統仿真

⒖3系統生物學概況

可免費登錄的相關網站

習題

參考文獻

第16章DNA計算

⒗1DNA計算的生物學基礎

⒗1.1DNA的組成

⒗1.2鹼基配對

⒗1.3DNA分子的製備

⒗1.4連線、合成DNA與RNA分子的酶類的作用

⒗1.5切割DNA的酶類的作用

⒗1.6DNA序列的測定

⒗2Adleman開創DNA計算研究領域的實驗

⒗3DNA計算的套用

⒗4問題與展望

可免費登錄的相關網站

習題

參考文獻

附表1生物信息資料庫

附表2中國、美國、英國、加拿大、澳大利亞科研教育機構開設生物信息學專業的情況

漢英名詞索引

英漢名詞索引    

相關詞條

相關搜尋

其它詞條