第一篇:生物信息學(xué)
剛剛接觸生物信息的時(shí)候,大家都比較迷茫,我覺(jué)得它是一個(gè)交叉學(xué)科,要想學(xué)好得有一定的毅力。我的導(dǎo)師要求我至少作到以下幾個(gè)方面:
1,數(shù)學(xué)基礎(chǔ)要好點(diǎn)。線(xiàn)代,高數(shù),統(tǒng)計(jì)等。
2,計(jì)算機(jī)知識(shí)。windows ,linux, unix系統(tǒng)等,各種常用生物軟件的使用??梢宰约赫襾?lái)一個(gè)個(gè)試。
3,matlab 里面有的關(guān)于生物方面的工具包也很多的。
4,生物知識(shí),不用說(shuō)的。
其他: 如果要深入的話(huà),最好會(huì)編程。什么java,perl,等。我是剛開(kāi)始學(xué)。大家多指教。
導(dǎo)師推薦了好幾本書(shū):
《生物信息學(xué)概論》 “Introduction to bioinformatics”(英)T K Attwood , D J Parry-Smith 著羅靜初 等譯北京大學(xué)出版社 2002年4月第一版本書(shū)從生物信息學(xué)的研究對(duì)象、意義出發(fā),介紹生物信息學(xué)研究的基本方法和常用工具。主要介紹的是核酸和蛋白質(zhì)序列的計(jì)算機(jī)分析方法,探討利用現(xiàn)有的計(jì)算機(jī)程序,從現(xiàn)有的數(shù)據(jù)庫(kù)中能夠獲取什么、不能夠獲取什么。全書(shū)共分十章:1.概論,2.信息網(wǎng)絡(luò),3.蛋白質(zhì)信息資源,4.基因組信息資源,5.DNA序列分析,6.雙序列比對(duì),7.多序列比對(duì),8.二次數(shù)據(jù)庫(kù)搜索,9.數(shù)據(jù)庫(kù)搜索實(shí)例,10.序列分析軟件包。每章末尾均提供了進(jìn)一步閱讀指南和有關(guān)的網(wǎng)址。這本書(shū)的一大特色在于豐富的例子和圖表,使讀者可以很直觀(guān)的了解和掌握書(shū)中的內(nèi)容。此外,書(shū)的末尾還附有與生物信息學(xué)相關(guān)的詞匯表。總的說(shuō)來(lái),這本書(shū)實(shí)用性強(qiáng),可以作為高等院校生物信息學(xué)教材,也可以作為生命科學(xué)和生物技術(shù)各領(lǐng)域分子生物學(xué)研究和開(kāi)發(fā)工作者的生物信息學(xué)參考書(shū)。
《生物信息學(xué)手冊(cè)》郝柏林 張淑譽(yù) 編著上??茖W(xué)技術(shù)出版社 2000年10月第一版一本手冊(cè)式的生物信息學(xué)書(shū)籍。除了介紹了生物信息學(xué),還包括了計(jì)算機(jī)及計(jì)算機(jī)網(wǎng)絡(luò)(這一部分提供了一些網(wǎng)址)和分子生物學(xué)的知識(shí)。更為重要的是,該書(shū)的主要部分?quot;生物信息數(shù)據(jù)庫(kù)“和”服務(wù)、軟件和算法“部分,提供了大量的網(wǎng)址。幾乎是每一個(gè)條目下面都有不少網(wǎng)址。這本書(shū)將網(wǎng)絡(luò)上的生物信息學(xué)資源進(jìn)行了索引式的介紹,并作了必要的說(shuō)明。書(shū)中列舉了近千條網(wǎng)址和引文,基本涵蓋了生物學(xué)研究的各個(gè)方面,堪稱(chēng)生物信息的汪洋大海中的導(dǎo)航圖。對(duì)生物信息學(xué)的服務(wù)、軟件和算法,本書(shū)也作了較全面的描述。本書(shū)可供廣大生命科學(xué)工作者以及由物理學(xué)、數(shù)學(xué)和計(jì)算機(jī)學(xué)轉(zhuǎn)入生命科學(xué)領(lǐng)域的研究教學(xué)人員參閱(上面可以查到很多網(wǎng)址)。
《生物信息學(xué)》趙國(guó)屏 等 編著科學(xué)出版社 2002年4月 第一版本書(shū)是”863“生物高科技叢書(shū)之一。它比較全面地介紹了生物信息學(xué)的若干個(gè)主要分支,并特別介紹了與人類(lèi)基因組研究
相關(guān)的生物信息學(xué)的一些較新成果;著重介紹了數(shù)據(jù)庫(kù)和數(shù)據(jù)庫(kù)的查詢(xún)、序列的同源比較及其在生物進(jìn)化研究中的應(yīng)用;以生物芯片中的生物信息學(xué)問(wèn)題為例,介紹與基因表達(dá)相關(guān)的生物信息學(xué)問(wèn)題;還介紹了蛋白質(zhì)結(jié)構(gòu)研究中的生物信息學(xué)問(wèn)題,以及與分子設(shè)計(jì)和藥物設(shè)計(jì)相關(guān)的生物信息學(xué)技術(shù)。本書(shū)可供生物信息學(xué)專(zhuān)業(yè)和生命科學(xué)相關(guān)專(zhuān)業(yè)的本科生、研究生和教學(xué)科研人員閱讀學(xué)習(xí),也可供相關(guān)專(zhuān)業(yè)的科技和應(yīng)用機(jī)構(gòu)的科研、管理和決策人員參考。注意,本書(shū)有很大篇幅是講基因芯片和蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的。
《生物信息學(xué)--基因和蛋白質(zhì)分析的實(shí)用指南》 ”Bioinformatics--A
Practical Guide to the Analysis of Genes and Proteins "Andreas D.Baxevanis B.F.Francis Ouellette 著李衍達(dá) 孫之榮 等 譯清華大學(xué)出版社 2000年8月 第一版這本書(shū)由前衛(wèi)計(jì)算生物學(xué)家撰寫(xiě),貫穿了已有的工具和數(shù)據(jù)庫(kù),包括應(yīng)用軟件、因特網(wǎng)資源、向數(shù)據(jù)庫(kù)提交DNA序列以及進(jìn)行序列分析和利用核酸序列與蛋白質(zhì)序列進(jìn)行預(yù)測(cè)的的方法。以下是該書(shū)的目錄:1.因特網(wǎng)與生物學(xué)家,2.GeneBank序列數(shù)據(jù)庫(kù),3.結(jié)構(gòu)數(shù)據(jù)庫(kù),4.應(yīng)用GCG進(jìn)行序列分析,5.生物數(shù)據(jù)庫(kù)的信息檢索,6.NCBI數(shù)據(jù)模型,7.序列比對(duì)和數(shù)據(jù)庫(kù)搜索,8.多序列比對(duì)和實(shí)際應(yīng)用,9.系統(tǒng)發(fā)育分析,10.利用核酸序列的預(yù)測(cè)方法,11.利用蛋白質(zhì)序列的預(yù)測(cè)方法,12.鼠類(lèi)和人類(lèi)公用物理圖譜數(shù)據(jù)庫(kù)漫游,13.ACEDB: 基因組信息數(shù)據(jù)庫(kù),14.提交DNA序列數(shù)據(jù)庫(kù)。本書(shū)有很多實(shí)際的序列和序列分析的例子。這本書(shū)適合高等院校的師生和從事生物工程研究的科技工作者閱讀。
在第14章提及的通訊資源:互聯(lián)網(wǎng)和通信地址;電話(huà)和傳真號(hào)碼
DDBJ/EMBL和GenBank的一般聯(lián)系信息以及提交DNA序列到這些數(shù)據(jù)庫(kù)的入口。
DDBJ(信息生物學(xué)中心,NIG)
地址:DDBJ,1111 Yata,Mishima,Shiznoka 411,Japan
傳真:81-559-81-6849
提交: ddbjsub@ddbj.nig.ac.jp
更新: ddbjupd@ddbj.nig.ac.jp
信息: ddbj@ddbj.nig.ac.jp
互聯(lián)網(wǎng)
主頁(yè):
WebIn:
GenBank(國(guó)家生物技術(shù)信息中心,NIH)
地址:Gen Bank National Center for Biotechnology Information, Nationtional Library of Medicine, National Institutes of Health, Building 38A, Room 8N805, Bethesda MD 20894
電話(huà):301-496-2475
傳真:301-480-9241
提交: gb-sub@ncbi.nlm.nih.gov
EST/GSS/STS batch-sub@ncbi.nlm.nih.gov
更新: update@ncbi.nlm.nih.gov
信息: datalib@ebi.ac.uk
互聯(lián)網(wǎng)
主頁(yè):
BankIt:
在DNA序列數(shù)據(jù)庫(kù)中使用的遺傳密碼:
DDBJ/EMBL/GenBank特征表文檔可用WWW方式獲得或者從EBI或NCBI的FTP服務(wù)器上得到PostScript文件。ftp://ncbi.nlm.nih.gov/genbank/docs/ ftp://ftp.ebi.ac.uk/pub/databases/embl/doc/
EMBL和GenBank數(shù)據(jù)庫(kù)的版本信息
EMBL ftp://ftp.ebi.ac.uk/pub/databases/embl/release/relnotes.doc
GenBank ftp://ncbi.nlm.nih.gov/genbank/gbrel.txt
Sequin: DNA序列數(shù)據(jù)庫(kù)的提交和更新工具 http://www.ncbi.nlm.nih.gov/Sequin
EST, STS和GTS主頁(yè),獲取信息和向這些特定GenBank數(shù)據(jù)庫(kù)提交序列
EST http://www.ncbi.nlm.nih.gov/dbEST
STS http://www.ncbi.nlm.nih.gov/dbSTS
GSS http://www.ncbi.nlm.nih.gov/dbGSS
HTGS主頁(yè):高吞吐量基因組序列資源,工具和信息 http://www.ncbi.nlm.nih.gov/HTGS
第二篇:生物信息學(xué)
淺談對(duì)生物信息學(xué)的認(rèn)識(shí)
摘要生物信息學(xué)是采用計(jì)算機(jī)技術(shù)和信息論方法研究蛋白質(zhì)及核酸序列等各種生物信息的采集、儲(chǔ)存、傳遞、檢索、分析和解讀的科學(xué), 是現(xiàn)代生命科學(xué)與信息科學(xué)、計(jì)算機(jī)科學(xué)、數(shù)學(xué)、統(tǒng)計(jì)學(xué)、物理學(xué)和化學(xué)等學(xué)科相互滲透而形成的交叉學(xué)科。經(jīng)過(guò)一學(xué)期的學(xué)習(xí),我學(xué)到了很多很有用的知識(shí),給我印象最深的有序列比對(duì)、蛋白質(zhì)結(jié)構(gòu)分析、核酸序列分析、數(shù)據(jù)庫(kù)及數(shù)據(jù)庫(kù)檢索等內(nèi)容。關(guān)鍵字:生物信息學(xué)認(rèn)識(shí)基因組學(xué)數(shù)據(jù)庫(kù)
時(shí)光飛逝,一學(xué)期馬上就要結(jié)束了,本學(xué)期的專(zhuān)業(yè)選修課也即將結(jié)束。在上課之前,我一直認(rèn)為生物信息學(xué)就是在講關(guān)于人類(lèi)及動(dòng)物的基因,以及基因之間的差別。但是,剛上了幾節(jié)課,我就發(fā)現(xiàn)生物信息學(xué)根本不是我想象的那么簡(jiǎn)單,就這樣我懷著對(duì)自己的懷疑和對(duì)這門(mén)課的好奇走進(jìn)了這門(mén)課。
生物信息學(xué)是一門(mén)新興的、正在迅速發(fā)展的交叉學(xué)科,美國(guó)國(guó)家基因組研究中心認(rèn)為, 生物信息學(xué)是一個(gè)代表生物學(xué)、數(shù)學(xué)和計(jì)算機(jī)的綜合力量的新興學(xué)(Bioinformatics is an emerging scientific discipline representing the combined power of biology,mathematics, and computers)。
現(xiàn)代生物信息學(xué)是采用計(jì)算機(jī)技術(shù)和信息論方法研究蛋白質(zhì)及核酸序列等各種生物信息的采集、儲(chǔ)存、傳遞、檢索、分析和解讀的科學(xué), 是現(xiàn)代生命科學(xué)與信息科學(xué)、計(jì)算機(jī)科學(xué)、數(shù)學(xué)、統(tǒng)計(jì)學(xué)、物理學(xué)和化學(xué)等學(xué)科相互滲透而形成的交叉學(xué)科。
在這短短的一學(xué)期課中,在老師的帶領(lǐng)下,我們學(xué)到了很多關(guān)
于生物信息學(xué)的知識(shí),其中給我印象最深的有序列比對(duì)、蛋白質(zhì)結(jié)
構(gòu)分析、核酸序列分析、數(shù)據(jù)庫(kù)及數(shù)據(jù)庫(kù)檢索等內(nèi)容。
比如,序列比對(duì),它的基本問(wèn)題是比較兩個(gè)或兩個(gè)以上符號(hào)序列的相似性或不相似性。從生物學(xué)角度來(lái)看,它包含很多意義;如從
相互重疊的序列片段中重構(gòu)DNA的完整序列等。老師主要給我們介
紹了blast比對(duì)。
再如,對(duì)蛋白質(zhì)的分析。比如我們實(shí)驗(yàn)測(cè)定了一條蛋白質(zhì)序列
或者從DNA序列翻譯得來(lái)一條蛋白質(zhì)序列,我們要借助生物信息學(xué)
方法來(lái)對(duì)它進(jìn)行基本性質(zhì)及結(jié)構(gòu)分析。其中基本性質(zhì)包括它的分子
量、氨基酸數(shù)目、排列順序、等電點(diǎn)分析等。結(jié)構(gòu)分析包括跨膜螺
旋分析等。要運(yùn)用的工具是protparam tool 和TMHMM。對(duì)于這兩
個(gè)工具我都進(jìn)行了實(shí)際操作練習(xí),我覺(jué)得這對(duì)我們以后的理論學(xué)習(xí)
和實(shí)驗(yàn)分析都非常重要?,F(xiàn)代生物信息學(xué)的主要研究領(lǐng)域及其進(jìn)展
1、基因組學(xué)和蛋白組學(xué)研究
基因組和蛋白組研究是生物信息學(xué)的主要內(nèi)容.同樣, 生物信息
學(xué)是基因組和蛋白組研究中必不可少的工具。
基因組學(xué)(Genomics)和蛋白組學(xué)(Proteomics)的實(shí)質(zhì)就是分析和解讀核酸和蛋白質(zhì)序列中所表達(dá)的結(jié)構(gòu)與功能的生物信息.這方面的研究已成為生物信息學(xué)的主要研究?jī)?nèi)容之一.一種生物的全部遺傳構(gòu)成被稱(chēng)為該種生物的基因組.有關(guān)基因組的研究稱(chēng)為基因組學(xué).其中, 序列基因組學(xué)(Sequence genomics)主要研究測(cè)序和核苷酸序列;結(jié)構(gòu)基因組學(xué)(Structural genomics)著重于遺傳圖譜、物理圖譜和測(cè)序等方面的研究;功能基因組學(xué)
(Functional genomics)則研究以轉(zhuǎn)錄圖為基礎(chǔ)的基因組表達(dá)圖譜;比較基因組學(xué)(Comparative ge2nomics)的研究?jī)?nèi)容包括對(duì)不同進(jìn)化階段基因組的比較和不同種群和群體基因組的比較。
蛋白組和蛋白組學(xué)的概念是隨基因組和基因組學(xué)的出現(xiàn)而出現(xiàn)的.蛋白組(proteme)的概念是由于基因表達(dá)水平并不能代表細(xì)胞中活性蛋白質(zhì)的數(shù)量, 基因組序列并不能描述活性蛋白質(zhì)所必需的翻譯后修飾和反映蛋白質(zhì)種類(lèi)和含量的動(dòng)態(tài)變化過(guò)程而提出的.在一定條件下某一基因組蛋白質(zhì)表達(dá)的數(shù)量類(lèi)型稱(chēng)為蛋白組, 代表這一有機(jī)體全部蛋白質(zhì)組成及其作用方式.有關(guān)蛋白組的研究稱(chēng)為蛋白組學(xué).其中, 蛋白組的研究技術(shù)與方法、雙向凝膠電泳圖譜以及對(duì)不同條件下蛋白組變化的比較分析是蛋白組學(xué)的主要研究?jī)?nèi)容。生物信息學(xué)在基因組和蛋白組研究中所起的作用主要有:(1)基因組信息結(jié)構(gòu)的計(jì)算分析.即對(duì)基因組數(shù)據(jù)進(jìn)行大規(guī)模并行計(jì)算并預(yù)測(cè)各種新基因和功能位點(diǎn), 研究大量非編碼區(qū)序列的信息結(jié)構(gòu)和可能的生物學(xué)意義。(2)模式生物全基因組信息結(jié)構(gòu)的比較研究.即
對(duì)已完成全基因組測(cè)序的各種模式生物的基因組信息結(jié)構(gòu)進(jìn)行比較分析, 包括同源序列的搜索比較和指導(dǎo)基因克隆.(3)功能基因組的相關(guān)信息分析, 包括對(duì)基因表達(dá)圖譜及其相關(guān)算法和軟件的研究, 與功能基因組信息相關(guān)的核酸、蛋白質(zhì)的空間結(jié)構(gòu)的預(yù)測(cè)模擬以及蛋白質(zhì)的功能預(yù)測(cè)。
2、生物信息數(shù)據(jù)庫(kù)
復(fù)雜的生物和生物界和日新月異的生命科學(xué)研究產(chǎn)出的大量的生物學(xué)信息,對(duì)這些信息的儲(chǔ)存、檢索、比較分析必須借助于計(jì)算機(jī)數(shù)據(jù)庫(kù)技術(shù), 包括各類(lèi)生物學(xué)信息數(shù)據(jù)庫(kù)的建立與維護(hù)、數(shù)據(jù)的添加與注釋、更新與查詢(xún)、數(shù)據(jù)庫(kù)資料的網(wǎng)絡(luò)化等研究?jī)?nèi)容?,F(xiàn)有的數(shù)據(jù)庫(kù)有:核酸序列數(shù)據(jù)庫(kù)(GenBank、EMBL、DDBJ)、基因組數(shù)據(jù)庫(kù)、基因圖譜數(shù)據(jù)庫(kù)、蛋白質(zhì)序列數(shù)據(jù)庫(kù)(SWTSS-
PROT、PIR)和蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)(Interpro)等。隨著生命科學(xué)的不斷發(fā)展,數(shù)據(jù)庫(kù)種類(lèi)不斷增加、結(jié)構(gòu)日益復(fù)雜、使用也越來(lái)越方便。
生物信息學(xué)作為一門(mén)新興學(xué)科已經(jīng)成為生命科學(xué)研究中必不可少的研究手段 本文對(duì)數(shù)據(jù)庫(kù)與數(shù)據(jù)庫(kù)搜索序列比對(duì)蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)藥物設(shè)計(jì)基因芯片技術(shù)幾個(gè)方面做了介紹較為系統(tǒng)地闡述了生物信息學(xué)在這些領(lǐng)域的應(yīng)用 當(dāng)然它所涉及的內(nèi)容與方法遠(yuǎn)遠(yuǎn)不只上面提到的那些 新基因和 的發(fā)現(xiàn)與鑒定非編碼區(qū)信息結(jié)構(gòu)分析遺傳密碼的起源和生物進(jìn)化完整基因組的比較
研究 大規(guī)?;蚬δ鼙磉_(dá)譜的分析等都是生物信息學(xué)研究的對(duì)象 相信不久的將來(lái)生物信息學(xué)會(huì)在生命
科學(xué)領(lǐng)域扮演越來(lái)越重要的角色。
參考文獻(xiàn):
1、現(xiàn)代生物信息學(xué)及其主要研究領(lǐng)域 蕭浪濤(湖南農(nóng)業(yè)大學(xué)理學(xué)院, 湖南長(zhǎng)沙 410128)
2、生物信息學(xué)技術(shù)進(jìn)展 郭志云 張懷渝 梁龍 軍事醫(yī)學(xué)科學(xué)院 生物工程研究所,北京100071;四川農(nóng)業(yè)大學(xué)生命科學(xué)及理學(xué)院,雅安 6250143、利用生物信息學(xué)技術(shù)研究蛋白功能的幾種方法 王劍利 楊章民綜述 王一理審閱 西安交通大學(xué)醫(yī)學(xué)院免疫病理學(xué)研究室(西安, 710061)
第三篇:生物信息學(xué)
生物信息學(xué)是上世紀(jì)90年代初人類(lèi)基因組計(jì)劃(HGP)依賴(lài),隨著基因組學(xué)、蛋白組學(xué)等新興學(xué)科的建立,逐漸發(fā)展起來(lái)的生物學(xué)、數(shù)學(xué)和計(jì)算機(jī)信息科學(xué)的一門(mén)交叉應(yīng)用學(xué)科。目前生物信息學(xué)的研究領(lǐng)域主要包括基于生物序列數(shù)據(jù)的整理和注釋、生物信息挖掘工具開(kāi)發(fā)及利用這些工具揭示生物學(xué)基礎(chǔ)理論知識(shí)等領(lǐng)域。生物信息學(xué)作為新型交叉應(yīng)用學(xué)科,可以依托本校已有的計(jì)算機(jī)科學(xué)、信息學(xué)、生物學(xué)和數(shù)學(xué)等學(xué)科優(yōu)勢(shì),充分展現(xiàn)投入少、見(jiàn)效快、起點(diǎn)高的特色,推動(dòng)學(xué)校學(xué)科建設(shè)和本科教學(xué)水平。
本實(shí)驗(yàn)指導(dǎo)書(shū)中的8個(gè)實(shí)驗(yàn)均設(shè)計(jì)為綜合性開(kāi)發(fā)實(shí)驗(yàn),面向生物信息學(xué)院全體本科學(xué)生和研究生,以及全校對(duì)生物信息學(xué)感興趣的其他專(zhuān)業(yè)學(xué)生開(kāi)放。生物信息學(xué)實(shí)驗(yàn)室將提供系統(tǒng)的保障,包括采用mail服務(wù)器和linux帳號(hào)管理等進(jìn)行實(shí)驗(yàn)過(guò)程管理和支持。限選《生物信息學(xué)及實(shí)驗(yàn)》的生物技術(shù)專(zhuān)業(yè)本科生至少選擇其中5個(gè)實(shí)驗(yàn),并不少于8個(gè)學(xué)時(shí),即為課程要求的0.5個(gè)學(xué)分。其他選修者按照課時(shí)和學(xué)校相關(guān)規(guī)定計(jì)算創(chuàng)新學(xué)分。實(shí)驗(yàn)一 熟悉生物信息學(xué)網(wǎng)站及其數(shù)據(jù)的生物學(xué)意義
實(shí)驗(yàn)?zāi)康模?/p>
培養(yǎng)學(xué)生利用互聯(lián)網(wǎng)資源獲取生物信息學(xué)研究前沿和相關(guān)數(shù)據(jù)的能力,熟悉生物信息學(xué)相關(guān)的一些重要國(guó)內(nèi)外網(wǎng)站,及其核酸序列、蛋白質(zhì)序列及代謝途徑等功能相關(guān)數(shù)據(jù)庫(kù),學(xué)會(huì)下載生物相關(guān)的信息數(shù)據(jù),了解不同的數(shù)據(jù)文件格式和其中重要的生物學(xué)意義。
實(shí)驗(yàn)原理:
利用互聯(lián)網(wǎng)資源檢索相關(guān)的國(guó)內(nèi)外生物信息學(xué)相關(guān)網(wǎng)站,如:NCBI、SANGER、TIGR、KEGG、SWISSPORT、Ensemble、中科院北京基因組研究所、北大生物信息
學(xué)中心等,下載其中相關(guān)的數(shù)據(jù),如fasta、genbank格式的核算和蛋白質(zhì)序列、pathway等數(shù)據(jù),理解其重要的生物學(xué)意義。
實(shí)驗(yàn)內(nèi)容:
1.瀏覽和搜索至少10個(gè)國(guó)外和至少5個(gè)國(guó)內(nèi)生物信息學(xué)相關(guān)網(wǎng)站,并描
述網(wǎng)站特征;
2.下載各網(wǎng)站的代表性數(shù)據(jù)各10條(組)以上,并說(shuō)明其生物學(xué)意義;
3.討論各網(wǎng)站適合做何種生物信息學(xué)研究的平臺(tái),并設(shè)計(jì)一個(gè)研究設(shè)想。實(shí)驗(yàn)報(bào)告:
1.各網(wǎng)站網(wǎng)址及特征描述;
2.代表性數(shù)據(jù)的下載和生物學(xué)意義的描述;
3.討論:這些生物信息學(xué)相關(guān)網(wǎng)站的信息資源,可以被那些生物信息學(xué)
研究所利用。
參考書(shū)目:
《生物信息學(xué)概論》 羅靜初 等譯,北京大學(xué)出版社,2002;《生物信息學(xué)手冊(cè)》 郝柏林 等著,上??萍汲霭嫔?,2004;
《生物信息學(xué)實(shí)驗(yàn)指導(dǎo)》 胡松年 等著,浙江大學(xué)出版社,2003。實(shí)驗(yàn)二 利用BLAST進(jìn)行序列比對(duì)
實(shí)驗(yàn)?zāi)康模?/p>
了解BLAST及其子程序的原理和基本參數(shù),熟練地應(yīng)用網(wǎng)絡(luò)平臺(tái)和Linux計(jì)算平臺(tái)進(jìn)行本地BLAST序列比對(duì),熟悉BLAST結(jié)果的格式和內(nèi)容并能描述其主要意義,同時(shí)比較網(wǎng)上平臺(tái)和本地平臺(tái)的優(yōu)缺點(diǎn)。
實(shí)驗(yàn)原理:
利用實(shí)驗(yàn)一下載的核算和蛋白質(zhì)序列,提交到NCBI或者其他擁有BLAST運(yùn)算平臺(tái)的網(wǎng)頁(yè)上,觀(guān)察其基本參數(shù)設(shè)定庫(kù)文件類(lèi)型,并得到計(jì)算結(jié)果;同時(shí)在本地服務(wù)器上學(xué)會(huì)用formatdb格式化庫(kù)文件,并輸入BLAST命令進(jìn)行計(jì)算,獲得結(jié)果文件。
實(shí)驗(yàn)內(nèi)容:
1.向網(wǎng)上BLAST服務(wù)器提交序列,得到匹配結(jié)果;
2.本地使用BLAST,格式化庫(kù)文件,輸入命令行得到匹配結(jié)果;
3.對(duì)結(jié)果文件進(jìn)行簡(jiǎn)要描述,闡述生物學(xué)意義。
實(shí)驗(yàn)報(bào)告:
1.闡述BLAST原理和比對(duì)步驟;
2.不同類(lèi)型BLAST的結(jié)果及其說(shuō)明;
3.討論:不同平臺(tái)運(yùn)行BLAST的需求比較。
參考書(shū)目:
《生物信息學(xué)概論》 羅靜初 等譯,北京大學(xué)出版社,2002;
《生物信息學(xué)實(shí)驗(yàn)指導(dǎo)》 胡松年 等著,浙江大學(xué)出版社,2003。
實(shí)驗(yàn)三 利用ClustalX(W)進(jìn)行
多序列聯(lián)配
實(shí)驗(yàn)?zāi)康模?/p>
掌握用Clustal X(W)工具及其基本參數(shù),對(duì)具有一定同源性和相似性的核酸與蛋白質(zhì)序列進(jìn)行聯(lián)配和聚類(lèi)分析,由此對(duì)這些物種的親緣關(guān)系進(jìn)行判斷,并且對(duì)這些序列在分子進(jìn)化過(guò)程中的保守性做出估計(jì)。
實(shí)驗(yàn)原理:
首先對(duì)于輸入的每一條序列,兩兩之間進(jìn)行聯(lián)配,總共進(jìn)行n*(n-1)/2次聯(lián)配,這一步通過(guò)一種快速的近似算法實(shí)現(xiàn),其得分用來(lái)計(jì)算指導(dǎo)樹(shù),系統(tǒng)樹(shù)圖能用于指導(dǎo)后面進(jìn)行的多序列聯(lián)配的過(guò)程。系統(tǒng)樹(shù)圖是通過(guò)UPGMA方法計(jì)算的。在系統(tǒng)樹(shù)圖繪制完以后,輸入的所有序列按照得分高低被分成n-1個(gè)組,然后再對(duì)組與組之間進(jìn)行聯(lián)配,這一步用Myers和Miller算法實(shí)現(xiàn)。
實(shí)驗(yàn)內(nèi)容:
1.明確軟件所支持的輸入文件格式,搜集整理出合適的數(shù)據(jù);
2.在Windows環(huán)境運(yùn)行Clustal X,在Linux環(huán)境運(yùn)行Clustal W;
3.實(shí)驗(yàn)結(jié)果及分析,用TREEV32或Njplotwin95生成NJ聚類(lèi)圖。
實(shí)驗(yàn)報(bào)告:
1.整理好的符合Clustal的序列數(shù)據(jù);
2.提交數(shù)據(jù)網(wǎng)頁(yè)記錄和各步驟記錄;
3.提供聚類(lèi)圖和多序列聯(lián)配圖,并說(shuō)明意義。
參考書(shū)目:
《生物信息學(xué)概論》 羅靜初 等譯,北京大學(xué)出版社,2002;
《生物信息學(xué)實(shí)驗(yàn)指導(dǎo)》 胡松年 等著,浙江大學(xué)出版社,2003。實(shí)驗(yàn)四 ESTS分析
實(shí)驗(yàn)?zāi)康模?/p>
熟悉使用一系列生物信息學(xué)分析工具對(duì)測(cè)序得到ESTs序列數(shù)據(jù)進(jìn)行聚類(lèi)處理,由此對(duì)獲得表達(dá)基因的豐度等相關(guān)信息,并且對(duì)這些表達(dá)基因進(jìn)行功能的初步詮釋?zhuān)瑸楹罄m(xù)實(shí)驗(yàn)通過(guò)設(shè)計(jì)RACE引物獲得全長(zhǎng)基因,以及進(jìn)一步的功能注
釋和代謝途徑分析做好準(zhǔn)備。
實(shí)驗(yàn)原理:
首先用crossmatch程序去除ESTs原始序列中的載體成分和引物成分,然后用phrap生成congtig和singlet,用blast程序進(jìn)一步將有同源性的contig和singlet進(jìn)行功能聚類(lèi),最后通過(guò)blast對(duì)聚類(lèi)獲得的cluster進(jìn)行功能注釋。在實(shí)驗(yàn)過(guò)程中將用到一些本實(shí)驗(yàn)室寫(xiě)好的perl程序用于連接各數(shù)據(jù)庫(kù)和工具軟件。
實(shí)驗(yàn)內(nèi)容:
1.運(yùn)行CodonCode Aligner程序,并用它建立工程文件,導(dǎo)入例子文件
夾里面的數(shù)據(jù);練習(xí)對(duì)序列的各種查看方式。
2.使用CodonCode Aligner程序里的Clip Ends, Trim Vector, Assemble
等功能,完成序列的剪切、去雜質(zhì)、組裝工作。
實(shí)驗(yàn)報(bào)告:
1.實(shí)驗(yàn)各步驟記錄和中間結(jié)果文件;
2.舉例簡(jiǎn)要說(shuō)明結(jié)果文件中數(shù)據(jù)的生物學(xué)意義。
參考書(shū)目:
《生物信息學(xué)概論》 羅靜初 等譯,北京大學(xué)出版社,2002;
《基因表達(dá)序列標(biāo)簽(EST)數(shù)據(jù)分析手冊(cè)》 胡松年 等著,浙江大學(xué)出版社,2005。
實(shí)驗(yàn)五 利用Primer Premier5.0設(shè)計(jì)
RACE引物
實(shí)驗(yàn)?zāi)康模?/p>
熟悉PCR引物設(shè)計(jì)工具Primer Premier5.0的一些基本功能,能夠根據(jù)實(shí)驗(yàn)需要選擇相應(yīng)的引物設(shè)計(jì)方法設(shè)計(jì)PCR引物。
實(shí)驗(yàn)原理:
PCR實(shí)驗(yàn)是當(dāng)代分子生物學(xué)的基本實(shí)驗(yàn)之一,由于目標(biāo)序列和實(shí)驗(yàn)?zāi)康牡牟煌?,相?yīng)設(shè)計(jì)引物的要求也不一樣。本實(shí)驗(yàn)延續(xù)ESTs分析結(jié)果,對(duì)于其中需要獲得全長(zhǎng)的基因進(jìn)行RACE引物的設(shè)計(jì),及5’和3’RACE引物,配合接頭序列設(shè)計(jì)單向引物,并模擬練習(xí)通過(guò)連接獲得全長(zhǎng)的基因CDS序列。最后設(shè)計(jì)已知全長(zhǎng)基因序列的PCR擴(kuò)增引物。
實(shí)驗(yàn)內(nèi)容:
1.從網(wǎng)站下載并安裝Primer Premier5.0;
2.從 GenBank 中任意獲取一個(gè) DNA 序列,設(shè)計(jì)出該序列的合適引物; 實(shí)驗(yàn)報(bào)告:
1.實(shí)驗(yàn)各步驟使用的數(shù)據(jù)、運(yùn)算平臺(tái)、結(jié)果文件記錄;
2.比較不同引物設(shè)計(jì)平臺(tái)和不同PCR實(shí)驗(yàn)的差別;
參考書(shū)目:
《生物信息學(xué)概論》 羅靜初 等譯,北京大學(xué)出版社,2002;《生物信息學(xué)實(shí)驗(yàn)指導(dǎo)》 胡松年 等著,浙江大學(xué)出版社,2003。
實(shí)驗(yàn)八 perl程序的安裝、編寫(xiě)、調(diào)試 實(shí)驗(yàn)?zāi)康模?/p>
培養(yǎng)學(xué)生能在windows和Linux兩種平臺(tái)安裝perl解釋器、編寫(xiě)perl程序以及debug和運(yùn)行的能力,熟悉perl語(yǔ)言基本語(yǔ)法,學(xué)會(huì)熟練編寫(xiě)和運(yùn)用perl程序進(jìn)行基礎(chǔ)生物信息學(xué)研究。
實(shí)驗(yàn)原理:
Perl語(yǔ)言是一門(mén)通用的腳本語(yǔ)言,具有強(qiáng)大的字符串處理功能,是生物信息學(xué)研究的強(qiáng)大幫手,學(xué)會(huì)了perl語(yǔ)言,就能方便地處理生物信息學(xué)研究中遇到的各種字符串文本,促進(jìn)研究的快速進(jìn)行。
實(shí)驗(yàn)內(nèi)容:
1.下載perl程序在Windows和Linux下的安裝包并進(jìn)行安裝;
2.編寫(xiě)簡(jiǎn)單的perl程序,并學(xué)會(huì)debug;
3.編寫(xiě)具有簡(jiǎn)單功能的堿基處理perl程序。
實(shí)驗(yàn)報(bào)告:
1.perl解釋器安裝方法;
2.perl解釋器debug方法;
3.討論:perl語(yǔ)言在生物信息學(xué)研究中所起到的積極作用。
參考書(shū)目:
《PERL 編程24學(xué)時(shí)教程》(美)皮爾斯著 王建華等譯,機(jī)械工業(yè)出版社,2000;
《生物信息學(xué)手冊(cè)》 郝柏林 等著,上??萍汲霭嫔?,2004;《生物信息學(xué)實(shí)驗(yàn)指導(dǎo)》 胡松年 等著,浙江大學(xué)出版社,2003
第四篇:生物信息學(xué)論文
生物信息學(xué)的進(jìn)展綜述
韓雪晴
(生物工程1201班,學(xué)號(hào):201224340124)
摘要:生物信息學(xué)是一門(mén)研究生物和生物相關(guān)系統(tǒng)中信息內(nèi)容和信息流向的綜合性系統(tǒng)科學(xué)。80年代以來(lái)新興的一門(mén)邊緣學(xué)科,信息在其中具有廣闊的前景。伴隨著人類(lèi)基因組計(jì)劃的勝利完成與生物信息學(xué)的發(fā)展有著密不可分的聯(lián)系,生物信息學(xué)的發(fā)展為生命科學(xué)的發(fā)展為生命科學(xué)的研究帶來(lái)了諸多的便利,對(duì)此作了簡(jiǎn)單的分析。
關(guān)鍵詞:生物信息學(xué);進(jìn)展;序列比對(duì);生物芯片
A review of the advances in Bioinformatics
Han Xueqing(Bioengineering, Class1201,Student ID:201224340124)
Abstract: Bioinformatics is the science of comprehensive system of information content and information flows to a study on the biological and bio related in the system.The edge of an emerging discipline since 80, has broad prospects in which information.With the human genome project was completed and the development of bioinformatics are inextricably linked, for the life science research development of bioinformatics for the development of life science has also brought a lot of convenience, has made the simple analysis.Keywords:
bioinformatics;progress;Sequence alignment;biochip
1、生物信息學(xué)的產(chǎn)生背景
生物信息學(xué)是20世紀(jì)80年代末開(kāi)始,隨著基因組測(cè)序數(shù)據(jù)迅猛增加而逐漸興起的一門(mén)學(xué)科[1]。應(yīng)用系統(tǒng)生物學(xué)的方法認(rèn)識(shí)生物體代謝、發(fā)育、分化、進(jìn)化以及疾患發(fā)生規(guī)律的不可或缺的工具[2]。及時(shí)、充分、有效地利用網(wǎng)絡(luò)上不斷增長(zhǎng)的生物信息數(shù)據(jù)庫(kù)資源,已經(jīng)成為生命科學(xué)和生物技術(shù)研究開(kāi)發(fā)的必要手段,從而誕生了生物信息學(xué)。
2、生物信息學(xué)研究?jī)?nèi)容
主要是利用計(jì)算機(jī)存儲(chǔ)核酸和蛋白質(zhì)序列,通過(guò)研究科學(xué)的算法,編制相應(yīng)的軟件對(duì)序列進(jìn)行分析、比較與預(yù)測(cè),從中發(fā)現(xiàn)規(guī)律。白細(xì)胞介素-6(IL-6)是機(jī)體重要的免疫因子,但在兩棲類(lèi)中未見(jiàn)報(bào)道。采用生物信息學(xué)方法對(duì)兩棲類(lèi)模式動(dòng)物非洲爪蟾IL-6進(jìn)行分析[3]。以人IL-6基因?qū)Ψ侵拮笖?shù)據(jù)庫(kù)進(jìn)行搜索、分析,并采用RT-PCR方法對(duì)所得序列進(jìn)行驗(yàn)證。結(jié)果表明,非洲爪蟾IL-6基因位于scaffold_52基因架上,具有保守的IL-6家族基序[4]。采用生物信息新方法進(jìn)行不同物種的免疫基因挖掘、克隆,是一種有效的方法[5]。
2.1序列比對(duì)
比較兩個(gè)或兩個(gè)以上符號(hào)序列的相似性或不相似性。序列比對(duì)是生物信息學(xué)的基礎(chǔ)。兩個(gè)序列的比對(duì)現(xiàn)在已有較成熟的動(dòng)態(tài)規(guī)劃算法,以及在此基礎(chǔ)上編寫(xiě)的比對(duì)軟件包BLAST和FASTA[6]。序列數(shù)據(jù)庫(kù)搜索最著名且最常用的工具之一便是BLAST算法。FASTA算法是另一族常用的序列比對(duì)及搜索工具[7]。
2.2結(jié)構(gòu)比對(duì)
比較兩個(gè)或兩個(gè)以上蛋白質(zhì)分子空間結(jié)構(gòu)的相似性或不相似性。
2.3蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)
從方法上來(lái)看有演繹法和歸納法兩種途徑。前者主要是從一些基本原理或假設(shè)出發(fā)來(lái)預(yù)測(cè)和研究蛋白質(zhì)的結(jié)構(gòu)和折疊過(guò)程。分子力學(xué)和分子動(dòng)力學(xué)屬這一范疇。后者主要是從觀(guān)察和總結(jié)已知結(jié)構(gòu)的蛋白質(zhì)結(jié)構(gòu)規(guī)律出發(fā)來(lái)預(yù)測(cè)未知蛋白質(zhì)的結(jié)構(gòu)[8]。
3、生物信息學(xué)的新技術(shù) 3.1 Lipshutz(Affymetrix,Santa clara,CA,USA)
描述了一種利用DNA探針陣列進(jìn)行基因組研究的方法,其原理是通過(guò)更有效有作圖、表達(dá)檢測(cè)和多態(tài)性篩選方法,可以實(shí)現(xiàn)對(duì)人類(lèi)基因組的測(cè)序[9]。光介導(dǎo)的化學(xué)合成法被應(yīng)用于制造小型化的高密度寡核苷酸探針的陣列,這種通過(guò)軟件包件設(shè)計(jì)的寡核苷酸探針陣列可用于多態(tài)性篩查、基因分型和表達(dá)檢測(cè)[10]。
3.2基因的功能分析
Overton(University of Pennsylvania School of Medicine,Philadelphia,PA,USA)論述了人類(lèi)基因組計(jì)劃的下一階段的任務(wù)基因組水平的基因功能分析。
4生物信息學(xué)前沿
4.1生物芯片技術(shù)
4.1.1生物芯片的簡(jiǎn)介
生物芯片技術(shù)是通過(guò)縮微技術(shù),根據(jù)分子間特異性地相互作用的原理,按照芯片上固化的生物材料的不同,可以將生物芯片劃分為基因芯片、蛋白質(zhì)芯片、細(xì)胞芯片和組織芯片。4.1.2生物芯片的基本內(nèi)容
生物芯片技術(shù)通過(guò)微加工工藝在厘米見(jiàn)方的芯片上集成有成千上萬(wàn)個(gè)與生命相關(guān)的信息分子,它可以對(duì)生命科學(xué)與醫(yī)學(xué)中的各種生物化學(xué)反應(yīng)過(guò)程進(jìn)行集成,從而實(shí)現(xiàn)對(duì)基因、配體、抗原等生物活性物質(zhì)進(jìn)行高效快捷的測(cè)試和分析。4.1.3生物芯片的發(fā)展
生物芯片將會(huì)給21世紀(jì)整個(gè)人類(lèi)生活帶來(lái)一場(chǎng)“革命”。生物芯片產(chǎn)業(yè)也有望與“微電子芯片”并列成為21世紀(jì)最大的產(chǎn)業(yè)之一。4.1.4與生物芯片相關(guān)的技術(shù)
平面微加工技術(shù)、微機(jī)械技術(shù)、CCD成像技術(shù)、基因芯片技術(shù)等。
4.2藥物設(shè)計(jì)與生物信息學(xué)
藥物基因組學(xué)可以說(shuō)是基因功能學(xué)與分子藥理學(xué)的有機(jī)結(jié)合,在很多方面這種結(jié)合是非常必要的。藥物基因組學(xué)以藥物效應(yīng)及安全性為目標(biāo),研究各種基因突變與藥效及安全性的關(guān)系。
4.3基因治療
基因治療(gene therapy)是指將外源正?;?qū)氚屑?xì)胞,以糾正或補(bǔ)償因基因缺陷和異常引起的疾病,達(dá)到治療目的[11]。也就是將外源基因通過(guò)基因轉(zhuǎn)移技術(shù)將其插入病人的適當(dāng)?shù)氖荏w細(xì)胞中,使外源基因制造的產(chǎn)物能治療某種疾病[12]。通過(guò)對(duì)miR-29a進(jìn)行靶基因預(yù)測(cè)及相關(guān)生物信息學(xué)分析,為miR-29a靶基因的實(shí)驗(yàn)驗(yàn)證提供數(shù)據(jù)支持,以期為深入研究miR-29a的生物學(xué)功能和調(diào)控機(jī)制提供理論指導(dǎo)[13]。從廣義說(shuō),基因治療還可包括從DNA水平采取的治療某些疾病的措施和新技術(shù)。在基因治療中迄今所應(yīng)用的目的基因轉(zhuǎn)移方法可分為兩大類(lèi):病毒方法和非病毒方法[14]。
4.4虛擬細(xì)胞--人工生命的模型
虛擬細(xì)胞是應(yīng)用信息科學(xué)的原理和技術(shù),通過(guò)數(shù)學(xué)的計(jì)算和分析,對(duì)細(xì)胞的結(jié)構(gòu)和功能進(jìn)行分析、整合和應(yīng)用,以模擬和再現(xiàn)細(xì)胞和生命的現(xiàn)象的一門(mén)新興學(xué)科。虛擬細(xì)胞亦稱(chēng)人工細(xì)胞或人工生命[15]。目前,國(guó)際上已有兩個(gè)虛擬細(xì)胞問(wèn)世,一個(gè)是日本的原核虛擬細(xì)胞模型,一個(gè)是美國(guó)的真核虛擬細(xì)胞模型。
參考文獻(xiàn)
[1].張陽(yáng)德,生物信息學(xué)(第二版)科學(xué)出版社,2010,21世紀(jì)高等院校教材ISBN978-7-03-023931-0 [2].邁克爾 R.巴恩斯(Barnes.M.R.),遺傳學(xué)工作者的生物信息學(xué),科學(xué)出版社2010年10月1日出版ISBN 9787030254900 [3].齊志濤;張啟煥;王資生;許偉;黃貝;王愛(ài)民,非洲爪蟾IL-6基因的克隆及生物信息學(xué)分析 出版日期: 2010 [4].齊志濤;張啟煥;黃貝;王資生;仇明;黃金田;許偉;王愛(ài)民.非洲爪蟾BAFF及其信號(hào)通路相關(guān)基因的比較生物信息學(xué)分析,生物技術(shù),2011,(4):
[5].廖明幟,生物背景學(xué)生的《生物信息學(xué)》課程教學(xué)思考與探索,教育教學(xué)論壇,2014年第36期
[6].Dan E.Krane&Michael L.Raymer,生物信息學(xué)概論,清華大學(xué)出版社 2010年出版
[7].Eddy S R.Profile Hidden Markov Models.Bioinformatics,1998,14(9):755~763 [8].Coombes KR,Fristche HA,Clarke,et al.Qutility control and peak finding for proteomics data collected from nipple aspirate fluid by surface-en-hanced laser desorption and ionization.Clin Chem,2013,49(10):1615~1623 [9].Lim HA,Batt tR.TIBTECH,1998;16(3)):104.[10].Williams n.Science,1997;277(5328):902.[11].顧健人,曹雪濤,基因治療,北京:科學(xué)出版社,2011 [12].余國(guó)膺,生物信息學(xué),中國(guó)心臟起博與心電生理雜志,2014年01期 [13].施偉杰
曾玉
姚純
曹笑梅
童華,miR-29a靶基因預(yù)測(cè)及其相關(guān)生物信息學(xué)分析,現(xiàn)代生物醫(yī)學(xué)進(jìn)展,2014年32期
[14].安冬
姜濤
張翠麗
殷玉玲
曹雪姣
辛毅,臧師竹利用生物信息學(xué)研究肥胖與2型糖尿病患者肝組織基因表達(dá)變化,《現(xiàn)代生物醫(yī)學(xué)進(jìn)展》 2014年30期
[15].孫冬泳,湯健,虛擬細(xì)胞-人工生命的模型,中華醫(yī)學(xué)雜志,2011,21(81):1342~1344
第五篇:生物信息學(xué)論文
淺談生物信息學(xué)的發(fā)展和前景
摘 要:本文闡述了生物信息學(xué)產(chǎn)生的背景,生物學(xué)數(shù)據(jù)庫(kù),生物信息學(xué)的主要研究?jī)?nèi)容,與生物信息學(xué)關(guān)系密切的數(shù)學(xué)和計(jì)算機(jī)科學(xué)技術(shù)領(lǐng)域,生物信息學(xué)產(chǎn)業(yè)等內(nèi)容,展望了其未來(lái)并提出了若干在我國(guó)發(fā)展生物信息學(xué)的建議。著重指出,理解大量生物學(xué)數(shù)據(jù)所包括的生物學(xué)意義已成為后基因組時(shí)代極其重要的課題。生物信息學(xué)的作用將日益重要。有理由認(rèn)為,今日生物學(xué)數(shù)據(jù)的巨大積累將導(dǎo)致重大生物學(xué)規(guī)律的發(fā)現(xiàn)。生物信息學(xué)的發(fā)展在國(guó)內(nèi)、外基本上都處在起步階段。因此,這是我國(guó)生物學(xué)趕超世界先進(jìn)水平的一個(gè)百年一遇的極好機(jī)會(huì)。關(guān)鍵字:生物信息學(xué)產(chǎn)生背景發(fā)展現(xiàn)狀前景
隨著生物科學(xué)技術(shù)的迅猛發(fā)展,生物信息數(shù)據(jù)資源的增長(zhǎng)呈現(xiàn)爆炸之勢(shì),同時(shí)計(jì)算機(jī)運(yùn) 算能力的提高和國(guó)際互聯(lián)網(wǎng)絡(luò)的發(fā)展使得對(duì)大規(guī)模數(shù)據(jù)的貯存、處理和傳輸成為可能,為了 快捷方便地對(duì)已知生物學(xué)信息進(jìn)行科學(xué)的組織、有效的管理和進(jìn)一步分析利用,一門(mén)由生命 科學(xué)和信息科學(xué)等多學(xué)科相結(jié)合特別是由分子生物學(xué)與計(jì)算機(jī)信息處理技術(shù)緊密結(jié)合而形 成的交叉學(xué)科——生物信息學(xué)(Bioinformatics)應(yīng)運(yùn)而生,并大大推動(dòng)了相關(guān)研究的開(kāi)展,被譽(yù)為“解讀生命天書(shū)的慧眼”。
一、生物信息學(xué)產(chǎn)生的背景
生物信息學(xué)是80年代未隨著人類(lèi)基因組計(jì)劃(Human genome project)的啟動(dòng)而興起的一門(mén)新的交叉學(xué)科。它通過(guò)對(duì)生物學(xué)實(shí)驗(yàn)數(shù)據(jù)的獲取、加工、存儲(chǔ)、檢索與分析,進(jìn)而達(dá)到揭示數(shù)據(jù)所蘊(yùn)含的生物學(xué)意義的目的。由于當(dāng)前生物信息學(xué)發(fā)展的主要推動(dòng)力來(lái)自分子生物學(xué),生物信息學(xué)的研究主要集中于核苷酸和氨基酸序列的存儲(chǔ)、分類(lèi)、檢索和分析等方面,所以目前生物信息學(xué)可以狹義地定義為:將計(jì)算機(jī)科學(xué)和數(shù)學(xué)應(yīng)用于生物大分子信息的獲取、加工、存儲(chǔ)、分類(lèi)、檢索與分析,以達(dá)到理解這些生物大分子信息的生物學(xué)意義的交叉學(xué)科。事實(shí)上,它是一門(mén)理論概念與實(shí)踐應(yīng)用并重的學(xué)科。
生物信息學(xué)的產(chǎn)生發(fā)展僅有10年左右的時(shí)間---bioinformatics這一名詞在1991年左右才在文獻(xiàn)中出現(xiàn),還只是出現(xiàn)在電子出版物的文本中。事實(shí)上,生物信息學(xué)的存在已有30多年,只不過(guò)最初常被稱(chēng)為基因組信息學(xué)。美國(guó)人類(lèi)基因組計(jì)劃中給基因組信息學(xué)的定義:它是一個(gè)學(xué)科領(lǐng)域,包含著基因組信息的獲取、處理、存儲(chǔ)、分配、分析和解釋的所有方面。
自1990年美國(guó)啟動(dòng)人類(lèi)基因組計(jì)劃以來(lái),人與模式生物基因組的測(cè)序工作進(jìn)展極為迅速。迄今已完成了約40多種生物的全基因組測(cè)序工作,人基因組約3x109堿基對(duì)的測(cè)序工作也接近完成。至2000年6月26日,被譽(yù)為生命“阿波羅計(jì)劃”的人類(lèi)基因組計(jì)劃終于完成了工作草圖,預(yù)示著完成人類(lèi)基因組計(jì)劃已經(jīng)指日可待。截止目前為止,僅登錄在美國(guó)GenBank數(shù)據(jù)庫(kù)中的DNA序列總量已超過(guò)70億堿基對(duì)。此外,迄今為止,已有一萬(wàn)多種蛋白質(zhì)的空間結(jié)構(gòu)以不同的分辨率被測(cè)定?;赾DNA序列測(cè)序所建立起來(lái)的EST數(shù)據(jù)庫(kù)其紀(jì)錄已達(dá)數(shù)百萬(wàn)條。在這些數(shù)據(jù)基礎(chǔ)上派生、整理出來(lái)的數(shù)據(jù)庫(kù)已達(dá)500余個(gè)。這一切構(gòu)成了一個(gè)生物學(xué)數(shù)據(jù)的海洋。這種科學(xué)數(shù)據(jù)的急速和海量積累,在人類(lèi)的科學(xué)研究歷史中是空前的。
數(shù)據(jù)并不等于信息和知識(shí),但卻是信息和知識(shí)的源泉,關(guān)鍵在于如何從中挖掘它們。與
正在以指數(shù)方式增長(zhǎng)的生物學(xué)數(shù)據(jù)相比,人類(lèi)相關(guān)知識(shí)的增長(zhǎng)(粗略地用每年發(fā)表的生物、醫(yī)學(xué)論文數(shù)來(lái)代表)卻十分緩慢。一方面是巨量的數(shù)據(jù);另一方面是我們?cè)卺t(yī)學(xué)、藥物、農(nóng)業(yè)和環(huán)保等方面對(duì)新知識(shí)的渴求,這些新知識(shí)將幫助人們改善其生存環(huán)境和提高生活質(zhì)量。這就構(gòu)成了一個(gè)極大的矛盾。這個(gè)矛盾就催生了一門(mén)新興的交叉科學(xué),這就是生物信息學(xué)。
二、生物信息學(xué)研究的發(fā)展現(xiàn)狀
資金和實(shí)力非常重要,生物信息的研究投入短期不算大,但是結(jié)合成果,其投入相當(dāng)?shù)拇?。因?yàn)槟壳吧镄畔⒅饕谟诮虒W(xué)和和研究,商業(yè)領(lǐng)域的應(yīng)用不算很廣。如一套LIMS加上軟件就要花上數(shù)千萬(wàn)。加上相關(guān)項(xiàng)目的研究開(kāi)發(fā),不是國(guó)內(nèi)相關(guān)的機(jī)構(gòu)所能承受的。所以需要得到政府的支持和幫助。以及有識(shí)之士的投入。否則我們又將遠(yuǎn)遠(yuǎn)落后國(guó)外。國(guó)內(nèi)的制藥行業(yè)將永不得翻身!基因的流失(國(guó)外一些國(guó)家打著給國(guó)內(nèi)免費(fèi)治療,分析疾病的考旗幟,暗中收集了國(guó)內(nèi)不同省份,地區(qū)的遺傳類(lèi)疾病和特性。這些資源,我們國(guó)家忽略,應(yīng)當(dāng)說(shuō)目前還沒(méi)有這樣的實(shí)力進(jìn)行研究)。落后就要挨打,21世紀(jì)是生物的世紀(jì)?;虼髴?zhàn)不可避免?;蚝图膊〉难芯亢艽蟪潭染褪菙?shù)據(jù)的分析。里面的領(lǐng)頭羊就是生物信息。國(guó)內(nèi)應(yīng)當(dāng)在基礎(chǔ)教學(xué),基礎(chǔ)研究并結(jié)合應(yīng)用力度。
當(dāng)然國(guó)內(nèi)的人才濟(jì)濟(jì),如有更多計(jì)算機(jī)領(lǐng)域和數(shù)學(xué)(統(tǒng)計(jì)方面的)人才參與到生物信息,將如虎添翼。目前我國(guó)生物信息學(xué)發(fā)展面臨著如下幾方面的困境:
⒈政府投資不足
雖然國(guó)際上生物信息學(xué)研究在各發(fā)達(dá)國(guó)家中比較受重視,但仍有不少研究機(jī)構(gòu)抱怨政府資金投入不夠。最近美國(guó)許多研究院紛紛申請(qǐng)要求政府加大生物信息學(xué)工具與數(shù)據(jù)庫(kù)方面的投入,而且歐洲、日本、澳大利亞在這些領(lǐng)域也存在著資金困擾問(wèn)題,歐洲生物信息學(xué)研究所(EBI)和歐洲基金會(huì)生命科學(xué)中心去年都遇到了麻煩。目前雖然危機(jī)已經(jīng)暫時(shí)渡過(guò),但未來(lái)幾年EBI數(shù)據(jù)庫(kù)和其它基礎(chǔ)結(jié)構(gòu)仍將受到資金短缺的困擾,一致有人發(fā)出了“免費(fèi)數(shù)據(jù)服務(wù)還能維持多久”的疑問(wèn)。
2.來(lái)自商業(yè)機(jī)構(gòu)的競(jìng)爭(zhēng)
基因組研究潛在的巨大商業(yè)利潤(rùn)使得國(guó)際上一批大型制藥公司和化學(xué)公司向該領(lǐng)域大規(guī)模的進(jìn)軍。世界最大制藥集團(tuán)之一的Giba Geigy和Sandoz合資建立的Novartis公司投資2.5億美元建立基因組研究所;Glaxo-Wellcome在基因組研究領(lǐng)域投入4700萬(wàn)美元,將研究人員增加一倍;Smith Kline公司花125億美元擴(kuò)展人基因組的順序,將生物信息學(xué)的研究人員從2人增加至70人,并將該公司藥物開(kāi)發(fā)項(xiàng)目中的25%建立在基因組學(xué)之上。這一方面給生物信息學(xué)發(fā)展注入了生機(jī),另一方面對(duì)那些政府支持的不以贏(yíng)利為目的的研究機(jī)構(gòu)造成了巨大的壓力,學(xué)術(shù)部門(mén)的資金投入遠(yuǎn)遠(yuǎn)不及工業(yè)部門(mén),其負(fù)面沖擊力不可忽視。畢竟經(jīng)濟(jì)利益的盲目追求會(huì)導(dǎo)致基因組研究的片面性,生物信息學(xué)長(zhǎng)路漫漫,保護(hù)這些學(xué)術(shù)部門(mén)的良好發(fā)展非常有必要。
3.專(zhuān)業(yè)人才匱乏
目前該領(lǐng)域缺乏懂得如何利用計(jì)算機(jī)技術(shù)處理大量生物數(shù)據(jù)的生物學(xué)家,不少生物學(xué)家只是將計(jì)算機(jī)用來(lái)打字或作為圖紙的替代品。甚至出現(xiàn)了這樣有趣的現(xiàn)象:制藥業(yè)、工業(yè)、農(nóng)業(yè)、生物技術(shù)研究團(tuán)體經(jīng)常在學(xué)術(shù)機(jī)構(gòu)大肆搜查那些“可疑人”,更有甚者他們彼此間互挖“墻角”。雖然對(duì)于人才的渴求與日俱增,但全世界也僅有20多個(gè)專(zhuān)業(yè)人才培訓(xùn)中心,而且這些中心本身也處在惡性循環(huán)中,那些經(jīng)培訓(xùn)后的人才往往由于高薪誘惑而投身應(yīng)用工業(yè)部門(mén),導(dǎo)致培訓(xùn)教育人員越來(lái)越少,出現(xiàn)“斷層”現(xiàn)象。
綜上所述,不難看出,生物信息學(xué)并不是一個(gè)足以樂(lè)觀(guān)的領(lǐng)域,究竟原因,是由于其是基于分子生物學(xué)與多種學(xué)科交叉而成的新學(xué)科,現(xiàn)有的形勢(shì)仍表現(xiàn)為各種學(xué)科的簡(jiǎn)單堆砌,相互之間的聯(lián)系并不是特別的緊密。在處理大規(guī)模數(shù)據(jù)方面,沒(méi)有行之有效的一般性方法;而對(duì)于大規(guī)模數(shù)據(jù)內(nèi)在的生成機(jī)制也沒(méi)有完全明了,這使得生物信息學(xué)的研究短期內(nèi)很難有突破性的結(jié)果。那么,要得到真正的解決,最終不能從計(jì)算機(jī)科學(xué)得到,真正地解決可能還是得從生物學(xué)自身,從數(shù)學(xué)上的新思路來(lái)獲得本質(zhì)性的動(dòng)力。毫無(wú)疑問(wèn),正如Dulbecco1986年所說(shuō):“人類(lèi)的DNA序列是人類(lèi)的真諦,這個(gè)世界上發(fā)生的一切事情,都與這一序列息息相關(guān)”。但要完全破譯這一序列以及相關(guān)的內(nèi)容,我們還有相當(dāng)長(zhǎng)的路要走。
三、生物信息學(xué)的發(fā)展前景
《第三次技術(shù)革命》里有這樣描述:“一場(chǎng)與工業(yè)革命和以計(jì)算機(jī)為基礎(chǔ)的革命有相同影響力的變化正在開(kāi)始。下一個(gè)偉大時(shí)代將是基因組革命時(shí)代,它現(xiàn)在處于初期階段。”基因組學(xué)的發(fā)展已經(jīng)進(jìn)入后基因組研究階段,致力于蛋白質(zhì)功能研究的蛋白質(zhì)組學(xué)和功能蛋白質(zhì)組學(xué)正在蓬勃發(fā)展,在生物信息學(xué)發(fā)展的帶動(dòng)下,我們必定能夠揭示各種生命現(xiàn)象的奧秘,并帶動(dòng)多個(gè)學(xué)科的跨越式發(fā)展。生物信息學(xué)的發(fā)展將對(duì)分子生物學(xué)、藥物設(shè)計(jì)、工作流管理和醫(yī)療成像等領(lǐng)域產(chǎn)生巨大的影響,極有可能引發(fā)新的產(chǎn)業(yè)革命。此外,生物信息學(xué)所倡導(dǎo)的全球范圍的資源共享也將對(duì)整個(gè)自然科學(xué)乃至人類(lèi)社會(huì)的發(fā)展產(chǎn)生深遠(yuǎn)的影響。有理由相信,今日生物學(xué)數(shù)據(jù)的巨大積累將導(dǎo)致重大生物學(xué)規(guī)律的發(fā)現(xiàn),生物信息學(xué)的發(fā)展在國(guó)內(nèi)、外基本上都處在起步階段,因此,這是我國(guó)生物學(xué)趕超世界先進(jìn)水平的一個(gè)百年一遇的極好機(jī)會(huì)。
生物學(xué)是生物信息學(xué)的核心和靈魂,數(shù)學(xué)與計(jì)算機(jī)技術(shù)則是它的基本工具。這一點(diǎn)必須著重指出。預(yù)測(cè)生物信息學(xué)的未來(lái)主要就是要預(yù)測(cè)他對(duì)生物學(xué)的發(fā)展將帶來(lái)什么樣的根本性的突破。這種預(yù)測(cè)是十分困難的,甚至幾乎不可能。但機(jī)不可失,時(shí)不再來(lái),鑒于生物信息學(xué)在我國(guó)生物信息學(xué)和經(jīng)濟(jì)發(fā)展中的重要意義和其發(fā)展的緊迫性,因此,由國(guó)家出面組織全國(guó)的力量,搞個(gè)類(lèi)似“兩彈一星”那樣的,但是,規(guī)模要小的多,花錢(qián)也少的多的生物信息學(xué)發(fā)展計(jì)劃,不是不可以考慮的。要充分發(fā)揮中央與地方,生物學(xué)科研究人員等方方面面的積極性。生物信息學(xué)研究投資少,見(jiàn)效快,可充分發(fā)揮我國(guó)智力資源豐富的長(zhǎng)處,是特別適合我國(guó)國(guó)情的一項(xiàng)研究領(lǐng)域。要在大學(xué)里建立生物信息學(xué)專(zhuān)業(yè),設(shè)立碩士點(diǎn)和博士點(diǎn),培養(yǎng)專(zhuān)門(mén)人才??梢越M織一大批數(shù)學(xué)、物理、化學(xué)和計(jì)算機(jī)科技工作者,在自愿的基礎(chǔ)上,學(xué)習(xí)有關(guān)的生物學(xué)知識(shí),開(kāi)展多方面的生物信息學(xué)研究。
經(jīng)過(guò)十幾年或更長(zhǎng)的時(shí)間的努力,逐漸使我國(guó)成為生物信息學(xué)研究強(qiáng)國(guó),是完全有可能的。信息學(xué)的商業(yè)價(jià)值十分顯著。國(guó)外很多大學(xué),研究機(jī)構(gòu),軟件公司甚至政府機(jī)構(gòu)紛紛成立各種生物信息機(jī)構(gòu),建立自立的生物信息集成系統(tǒng),研制這方面的軟件,重金招聘人才,期望從中獲取更多的生物信息和數(shù)據(jù)加以研究和利用,縮短藥物開(kāi)發(fā)周期,搶注基因?qū)@@取更大利潤(rùn)。我國(guó)如不加大資金投入力度,將來(lái)可能會(huì)花更多的錢(qián)去購(gòu)買(mǎi)別人的軟件,使用專(zhuān)利基因或購(gòu)買(mǎi)新的藥物。所幸,我國(guó)也開(kāi)始重視這一學(xué)科:南、北方人類(lèi)基因組中心的相繼建成,北大生物城的破土動(dòng)工等,標(biāo)志著我國(guó)對(duì)生物信息學(xué)的重視。我們有理由相信,我國(guó)的生物信息學(xué)在21世紀(jì)會(huì)有巨大的飛躍。
參考文獻(xiàn)
1.陳潤(rùn)生.生物信息學(xué).生物物理學(xué)報(bào),1999,15(1):5
2.北京生物技術(shù)和新醫(yī)藥產(chǎn)業(yè)促進(jìn)中心.世紀(jì)之交的新科學(xué):生物信息學(xué).生物技術(shù)通 報(bào),1999,(8):49
3.楊福愉.展望21世紀(jì)的分子生物學(xué).生物物理學(xué)報(bào),1999,15(1):1
4.鄭國(guó)清,張瑞玲,;生物信息學(xué)的形成與發(fā)展;河南農(nóng)業(yè)科學(xué);2002.11
5.王玉梅,王艷.國(guó)外生物信息學(xué)發(fā)展動(dòng)態(tài)分析;科技情報(bào)開(kāi)發(fā)與經(jīng)濟(jì);2002.06
6.張春霆.生物信息學(xué)昀壩狀與展望;世界科技研究與發(fā)展.2000,22(6)