第一篇:生物信息學(xué)教材 beta 0
生物信息學(xué)教材 beta 0.9
1.生物信息入門
生物信息學(xué)札記-樊龍江(浙江大學(xué))#這套材料我認(rèn)為很適合新手入門;
原版-蛋白和核酸序列分析 #我看的第一本生物信息書;
Bioinformatics-Sequence and Genome Analysis.pdf #David mount的書,不錯(cuò);
eDictionary-Bioinformatics-AJ367.pdf #一些名詞解釋,還好。
這部分的書怎么看呢?建議是,仔細(xì)看前三本中的一本,隨便哪本都可以,然后翻翻其他兩本,最后一本描幾眼。一個(gè)月差不多可以入門了。
2.計(jì)算機(jī)基礎(chǔ)
beginning perl for bioinformatics #這個(gè)材料可能需要很仔細(xì)看,寫得很簡(jiǎn)單,很適合生物學(xué)背景的人快速掌握計(jì)算機(jī)的必備知識(shí);
HMM #可看可不看;
MCMC #看看就是了;
MySQL網(wǎng)絡(luò)數(shù)據(jù)庫(kù)指南; #Mysql比較好的一套教程,看個(gè)幾章,數(shù)據(jù)庫(kù)也就差不多了; 數(shù)據(jù)挖掘; #有人需要,所以我提供
Algorithms in Bioinformatics.zip #喜歡算法的可以看看
Bioinformatics Computing.pdf #可看可不看
Developing Bioinformatics Computer Skills(doc).rar #可看可不看
Intro to Machine Learning.zip
生物序列比對(duì)中的算法.rar
用Maple和MATLAB解決科學(xué)計(jì)算問題(第三版).pdf
這個(gè)部分,只有perl和mysql(第一本和第四本)是必須看的,其他的隨便了。不然耽誤的時(shí)間太多。
3.統(tǒng)計(jì)學(xué)基礎(chǔ)
超級(jí)好的統(tǒng)計(jì)教材,適合R入門
R-intro.pdf
SAS 8教程@pandia.exe
stata教程@zhangdog.exe
統(tǒng)計(jì)教程@zhangdog.exe
這個(gè)部分,如果真的要學(xué)統(tǒng)計(jì)學(xué),第一本是最好最合適的。同時(shí)感謝nep2004提供本書。呵呵,確實(shí)是超級(jí)好。
.分子進(jìn)化基礎(chǔ)
暑期進(jìn)化學(xué)習(xí)班
這個(gè)部分我沒有什么像樣子的教材。主要看的都是紙版的書。Nei的綠皮書是首選,大家有沒有什么推薦?我的這套資料是去年昆明聽課的材料。還好。
第二篇:生物信息學(xué)
生物信息學(xué)是上世紀(jì)90年代初人類基因組計(jì)劃(HGP)依賴,隨著基因組學(xué)、蛋白組學(xué)等新興學(xué)科的建立,逐漸發(fā)展起來的生物學(xué)、數(shù)學(xué)和計(jì)算機(jī)信息科學(xué)的一門交叉應(yīng)用學(xué)科。目前生物信息學(xué)的研究領(lǐng)域主要包括基于生物序列數(shù)據(jù)的整理和注釋、生物信息挖掘工具開發(fā)及利用這些工具揭示生物學(xué)基礎(chǔ)理論知識(shí)等領(lǐng)域。生物信息學(xué)作為新型交叉應(yīng)用學(xué)科,可以依托本校已有的計(jì)算機(jī)科學(xué)、信息學(xué)、生物學(xué)和數(shù)學(xué)等學(xué)科優(yōu)勢(shì),充分展現(xiàn)投入少、見效快、起點(diǎn)高的特色,推動(dòng)學(xué)校學(xué)科建設(shè)和本科教學(xué)水平。
本實(shí)驗(yàn)指導(dǎo)書中的8個(gè)實(shí)驗(yàn)均設(shè)計(jì)為綜合性開發(fā)實(shí)驗(yàn),面向生物信息學(xué)院全體本科學(xué)生和研究生,以及全校對(duì)生物信息學(xué)感興趣的其他專業(yè)學(xué)生開放。生物信息學(xué)實(shí)驗(yàn)室將提供系統(tǒng)的保障,包括采用mail服務(wù)器和linux帳號(hào)管理等進(jìn)行實(shí)驗(yàn)過程管理和支持。限選《生物信息學(xué)及實(shí)驗(yàn)》的生物技術(shù)專業(yè)本科生至少選擇其中5個(gè)實(shí)驗(yàn),并不少于8個(gè)學(xué)時(shí),即為課程要求的0.5個(gè)學(xué)分。其他選修者按照課時(shí)和學(xué)校相關(guān)規(guī)定計(jì)算創(chuàng)新學(xué)分。實(shí)驗(yàn)一 熟悉生物信息學(xué)網(wǎng)站及其數(shù)據(jù)的生物學(xué)意義
實(shí)驗(yàn)?zāi)康模?/p>
培養(yǎng)學(xué)生利用互聯(lián)網(wǎng)資源獲取生物信息學(xué)研究前沿和相關(guān)數(shù)據(jù)的能力,熟悉生物信息學(xué)相關(guān)的一些重要國(guó)內(nèi)外網(wǎng)站,及其核酸序列、蛋白質(zhì)序列及代謝途徑等功能相關(guān)數(shù)據(jù)庫(kù),學(xué)會(huì)下載生物相關(guān)的信息數(shù)據(jù),了解不同的數(shù)據(jù)文件格式和其中重要的生物學(xué)意義。
實(shí)驗(yàn)原理:
利用互聯(lián)網(wǎng)資源檢索相關(guān)的國(guó)內(nèi)外生物信息學(xué)相關(guān)網(wǎng)站,如:NCBI、SANGER、TIGR、KEGG、SWISSPORT、Ensemble、中科院北京基因組研究所、北大生物信息
學(xué)中心等,下載其中相關(guān)的數(shù)據(jù),如fasta、genbank格式的核算和蛋白質(zhì)序列、pathway等數(shù)據(jù),理解其重要的生物學(xué)意義。
實(shí)驗(yàn)內(nèi)容:
1.瀏覽和搜索至少10個(gè)國(guó)外和至少5個(gè)國(guó)內(nèi)生物信息學(xué)相關(guān)網(wǎng)站,并描
述網(wǎng)站特征;
2.下載各網(wǎng)站的代表性數(shù)據(jù)各10條(組)以上,并說明其生物學(xué)意義;
3.討論各網(wǎng)站適合做何種生物信息學(xué)研究的平臺(tái),并設(shè)計(jì)一個(gè)研究設(shè)想。實(shí)驗(yàn)報(bào)告:
1.各網(wǎng)站網(wǎng)址及特征描述;
2.代表性數(shù)據(jù)的下載和生物學(xué)意義的描述;
3.討論:這些生物信息學(xué)相關(guān)網(wǎng)站的信息資源,可以被那些生物信息學(xué)
研究所利用。
參考書目:
《生物信息學(xué)概論》 羅靜初 等譯,北京大學(xué)出版社,2002;《生物信息學(xué)手冊(cè)》 郝柏林 等著,上??萍汲霭嫔?,2004;
《生物信息學(xué)實(shí)驗(yàn)指導(dǎo)》 胡松年 等著,浙江大學(xué)出版社,2003。實(shí)驗(yàn)二 利用BLAST進(jìn)行序列比對(duì)
實(shí)驗(yàn)?zāi)康模?/p>
了解BLAST及其子程序的原理和基本參數(shù),熟練地應(yīng)用網(wǎng)絡(luò)平臺(tái)和Linux計(jì)算平臺(tái)進(jìn)行本地BLAST序列比對(duì),熟悉BLAST結(jié)果的格式和內(nèi)容并能描述其主要意義,同時(shí)比較網(wǎng)上平臺(tái)和本地平臺(tái)的優(yōu)缺點(diǎn)。
實(shí)驗(yàn)原理:
利用實(shí)驗(yàn)一下載的核算和蛋白質(zhì)序列,提交到NCBI或者其他擁有BLAST運(yùn)算平臺(tái)的網(wǎng)頁上,觀察其基本參數(shù)設(shè)定庫(kù)文件類型,并得到計(jì)算結(jié)果;同時(shí)在本地服務(wù)器上學(xué)會(huì)用formatdb格式化庫(kù)文件,并輸入BLAST命令進(jìn)行計(jì)算,獲得結(jié)果文件。
實(shí)驗(yàn)內(nèi)容:
1.向網(wǎng)上BLAST服務(wù)器提交序列,得到匹配結(jié)果;
2.本地使用BLAST,格式化庫(kù)文件,輸入命令行得到匹配結(jié)果;
3.對(duì)結(jié)果文件進(jìn)行簡(jiǎn)要描述,闡述生物學(xué)意義。
實(shí)驗(yàn)報(bào)告:
1.闡述BLAST原理和比對(duì)步驟;
2.不同類型BLAST的結(jié)果及其說明;
3.討論:不同平臺(tái)運(yùn)行BLAST的需求比較。
參考書目:
《生物信息學(xué)概論》 羅靜初 等譯,北京大學(xué)出版社,2002;
《生物信息學(xué)實(shí)驗(yàn)指導(dǎo)》 胡松年 等著,浙江大學(xué)出版社,2003。
實(shí)驗(yàn)三 利用ClustalX(W)進(jìn)行
多序列聯(lián)配
實(shí)驗(yàn)?zāi)康模?/p>
掌握用Clustal X(W)工具及其基本參數(shù),對(duì)具有一定同源性和相似性的核酸與蛋白質(zhì)序列進(jìn)行聯(lián)配和聚類分析,由此對(duì)這些物種的親緣關(guān)系進(jìn)行判斷,并且對(duì)這些序列在分子進(jìn)化過程中的保守性做出估計(jì)。
實(shí)驗(yàn)原理:
首先對(duì)于輸入的每一條序列,兩兩之間進(jìn)行聯(lián)配,總共進(jìn)行n*(n-1)/2次聯(lián)配,這一步通過一種快速的近似算法實(shí)現(xiàn),其得分用來計(jì)算指導(dǎo)樹,系統(tǒng)樹圖能用于指導(dǎo)后面進(jìn)行的多序列聯(lián)配的過程。系統(tǒng)樹圖是通過UPGMA方法計(jì)算的。在系統(tǒng)樹圖繪制完以后,輸入的所有序列按照得分高低被分成n-1個(gè)組,然后再對(duì)組與組之間進(jìn)行聯(lián)配,這一步用Myers和Miller算法實(shí)現(xiàn)。
實(shí)驗(yàn)內(nèi)容:
1.明確軟件所支持的輸入文件格式,搜集整理出合適的數(shù)據(jù);
2.在Windows環(huán)境運(yùn)行Clustal X,在Linux環(huán)境運(yùn)行Clustal W;
3.實(shí)驗(yàn)結(jié)果及分析,用TREEV32或Njplotwin95生成NJ聚類圖。
實(shí)驗(yàn)報(bào)告:
1.整理好的符合Clustal的序列數(shù)據(jù);
2.提交數(shù)據(jù)網(wǎng)頁記錄和各步驟記錄;
3.提供聚類圖和多序列聯(lián)配圖,并說明意義。
參考書目:
《生物信息學(xué)概論》 羅靜初 等譯,北京大學(xué)出版社,2002;
《生物信息學(xué)實(shí)驗(yàn)指導(dǎo)》 胡松年 等著,浙江大學(xué)出版社,2003。實(shí)驗(yàn)四 ESTS分析
實(shí)驗(yàn)?zāi)康模?/p>
熟悉使用一系列生物信息學(xué)分析工具對(duì)測(cè)序得到ESTs序列數(shù)據(jù)進(jìn)行聚類處理,由此對(duì)獲得表達(dá)基因的豐度等相關(guān)信息,并且對(duì)這些表達(dá)基因進(jìn)行功能的初步詮釋,為后續(xù)實(shí)驗(yàn)通過設(shè)計(jì)RACE引物獲得全長(zhǎng)基因,以及進(jìn)一步的功能注
釋和代謝途徑分析做好準(zhǔn)備。
實(shí)驗(yàn)原理:
首先用crossmatch程序去除ESTs原始序列中的載體成分和引物成分,然后用phrap生成congtig和singlet,用blast程序進(jìn)一步將有同源性的contig和singlet進(jìn)行功能聚類,最后通過blast對(duì)聚類獲得的cluster進(jìn)行功能注釋。在實(shí)驗(yàn)過程中將用到一些本實(shí)驗(yàn)室寫好的perl程序用于連接各數(shù)據(jù)庫(kù)和工具軟件。
實(shí)驗(yàn)內(nèi)容:
1.運(yùn)行CodonCode Aligner程序,并用它建立工程文件,導(dǎo)入例子文件
夾里面的數(shù)據(jù);練習(xí)對(duì)序列的各種查看方式。
2.使用CodonCode Aligner程序里的Clip Ends, Trim Vector, Assemble
等功能,完成序列的剪切、去雜質(zhì)、組裝工作。
實(shí)驗(yàn)報(bào)告:
1.實(shí)驗(yàn)各步驟記錄和中間結(jié)果文件;
2.舉例簡(jiǎn)要說明結(jié)果文件中數(shù)據(jù)的生物學(xué)意義。
參考書目:
《生物信息學(xué)概論》 羅靜初 等譯,北京大學(xué)出版社,2002;
《基因表達(dá)序列標(biāo)簽(EST)數(shù)據(jù)分析手冊(cè)》 胡松年 等著,浙江大學(xué)出版社,2005。
實(shí)驗(yàn)五 利用Primer Premier5.0設(shè)計(jì)
RACE引物
實(shí)驗(yàn)?zāi)康模?/p>
熟悉PCR引物設(shè)計(jì)工具Primer Premier5.0的一些基本功能,能夠根據(jù)實(shí)驗(yàn)需要選擇相應(yīng)的引物設(shè)計(jì)方法設(shè)計(jì)PCR引物。
實(shí)驗(yàn)原理:
PCR實(shí)驗(yàn)是當(dāng)代分子生物學(xué)的基本實(shí)驗(yàn)之一,由于目標(biāo)序列和實(shí)驗(yàn)?zāi)康牡牟煌?,相?yīng)設(shè)計(jì)引物的要求也不一樣。本實(shí)驗(yàn)延續(xù)ESTs分析結(jié)果,對(duì)于其中需要獲得全長(zhǎng)的基因進(jìn)行RACE引物的設(shè)計(jì),及5’和3’RACE引物,配合接頭序列設(shè)計(jì)單向引物,并模擬練習(xí)通過連接獲得全長(zhǎng)的基因CDS序列。最后設(shè)計(jì)已知全長(zhǎng)基因序列的PCR擴(kuò)增引物。
實(shí)驗(yàn)內(nèi)容:
1.從網(wǎng)站下載并安裝Primer Premier5.0;
2.從 GenBank 中任意獲取一個(gè) DNA 序列,設(shè)計(jì)出該序列的合適引物; 實(shí)驗(yàn)報(bào)告:
1.實(shí)驗(yàn)各步驟使用的數(shù)據(jù)、運(yùn)算平臺(tái)、結(jié)果文件記錄;
2.比較不同引物設(shè)計(jì)平臺(tái)和不同PCR實(shí)驗(yàn)的差別;
參考書目:
《生物信息學(xué)概論》 羅靜初 等譯,北京大學(xué)出版社,2002;《生物信息學(xué)實(shí)驗(yàn)指導(dǎo)》 胡松年 等著,浙江大學(xué)出版社,2003。
實(shí)驗(yàn)八 perl程序的安裝、編寫、調(diào)試 實(shí)驗(yàn)?zāi)康模?/p>
培養(yǎng)學(xué)生能在windows和Linux兩種平臺(tái)安裝perl解釋器、編寫perl程序以及debug和運(yùn)行的能力,熟悉perl語言基本語法,學(xué)會(huì)熟練編寫和運(yùn)用perl程序進(jìn)行基礎(chǔ)生物信息學(xué)研究。
實(shí)驗(yàn)原理:
Perl語言是一門通用的腳本語言,具有強(qiáng)大的字符串處理功能,是生物信息學(xué)研究的強(qiáng)大幫手,學(xué)會(huì)了perl語言,就能方便地處理生物信息學(xué)研究中遇到的各種字符串文本,促進(jìn)研究的快速進(jìn)行。
實(shí)驗(yàn)內(nèi)容:
1.下載perl程序在Windows和Linux下的安裝包并進(jìn)行安裝;
2.編寫簡(jiǎn)單的perl程序,并學(xué)會(huì)debug;
3.編寫具有簡(jiǎn)單功能的堿基處理perl程序。
實(shí)驗(yàn)報(bào)告:
1.perl解釋器安裝方法;
2.perl解釋器debug方法;
3.討論:perl語言在生物信息學(xué)研究中所起到的積極作用。
參考書目:
《PERL 編程24學(xué)時(shí)教程》(美)皮爾斯著 王建華等譯,機(jī)械工業(yè)出版社,2000;
《生物信息學(xué)手冊(cè)》 郝柏林 等著,上??萍汲霭嫔?,2004;《生物信息學(xué)實(shí)驗(yàn)指導(dǎo)》 胡松年 等著,浙江大學(xué)出版社,2003
第三篇:生物信息學(xué)
淺談對(duì)生物信息學(xué)的認(rèn)識(shí)
摘要生物信息學(xué)是采用計(jì)算機(jī)技術(shù)和信息論方法研究蛋白質(zhì)及核酸序列等各種生物信息的采集、儲(chǔ)存、傳遞、檢索、分析和解讀的科學(xué), 是現(xiàn)代生命科學(xué)與信息科學(xué)、計(jì)算機(jī)科學(xué)、數(shù)學(xué)、統(tǒng)計(jì)學(xué)、物理學(xué)和化學(xué)等學(xué)科相互滲透而形成的交叉學(xué)科。經(jīng)過一學(xué)期的學(xué)習(xí),我學(xué)到了很多很有用的知識(shí),給我印象最深的有序列比對(duì)、蛋白質(zhì)結(jié)構(gòu)分析、核酸序列分析、數(shù)據(jù)庫(kù)及數(shù)據(jù)庫(kù)檢索等內(nèi)容。關(guān)鍵字:生物信息學(xué)認(rèn)識(shí)基因組學(xué)數(shù)據(jù)庫(kù)
時(shí)光飛逝,一學(xué)期馬上就要結(jié)束了,本學(xué)期的專業(yè)選修課也即將結(jié)束。在上課之前,我一直認(rèn)為生物信息學(xué)就是在講關(guān)于人類及動(dòng)物的基因,以及基因之間的差別。但是,剛上了幾節(jié)課,我就發(fā)現(xiàn)生物信息學(xué)根本不是我想象的那么簡(jiǎn)單,就這樣我懷著對(duì)自己的懷疑和對(duì)這門課的好奇走進(jìn)了這門課。
生物信息學(xué)是一門新興的、正在迅速發(fā)展的交叉學(xué)科,美國(guó)國(guó)家基因組研究中心認(rèn)為, 生物信息學(xué)是一個(gè)代表生物學(xué)、數(shù)學(xué)和計(jì)算機(jī)的綜合力量的新興學(xué)(Bioinformatics is an emerging scientific discipline representing the combined power of biology,mathematics, and computers)。
現(xiàn)代生物信息學(xué)是采用計(jì)算機(jī)技術(shù)和信息論方法研究蛋白質(zhì)及核酸序列等各種生物信息的采集、儲(chǔ)存、傳遞、檢索、分析和解讀的科學(xué), 是現(xiàn)代生命科學(xué)與信息科學(xué)、計(jì)算機(jī)科學(xué)、數(shù)學(xué)、統(tǒng)計(jì)學(xué)、物理學(xué)和化學(xué)等學(xué)科相互滲透而形成的交叉學(xué)科。
在這短短的一學(xué)期課中,在老師的帶領(lǐng)下,我們學(xué)到了很多關(guān)
于生物信息學(xué)的知識(shí),其中給我印象最深的有序列比對(duì)、蛋白質(zhì)結(jié)
構(gòu)分析、核酸序列分析、數(shù)據(jù)庫(kù)及數(shù)據(jù)庫(kù)檢索等內(nèi)容。
比如,序列比對(duì),它的基本問題是比較兩個(gè)或兩個(gè)以上符號(hào)序列的相似性或不相似性。從生物學(xué)角度來看,它包含很多意義;如從
相互重疊的序列片段中重構(gòu)DNA的完整序列等。老師主要給我們介
紹了blast比對(duì)。
再如,對(duì)蛋白質(zhì)的分析。比如我們實(shí)驗(yàn)測(cè)定了一條蛋白質(zhì)序列
或者從DNA序列翻譯得來一條蛋白質(zhì)序列,我們要借助生物信息學(xué)
方法來對(duì)它進(jìn)行基本性質(zhì)及結(jié)構(gòu)分析。其中基本性質(zhì)包括它的分子
量、氨基酸數(shù)目、排列順序、等電點(diǎn)分析等。結(jié)構(gòu)分析包括跨膜螺
旋分析等。要運(yùn)用的工具是protparam tool 和TMHMM。對(duì)于這兩
個(gè)工具我都進(jìn)行了實(shí)際操作練習(xí),我覺得這對(duì)我們以后的理論學(xué)習(xí)
和實(shí)驗(yàn)分析都非常重要?,F(xiàn)代生物信息學(xué)的主要研究領(lǐng)域及其進(jìn)展
1、基因組學(xué)和蛋白組學(xué)研究
基因組和蛋白組研究是生物信息學(xué)的主要內(nèi)容.同樣, 生物信息
學(xué)是基因組和蛋白組研究中必不可少的工具。
基因組學(xué)(Genomics)和蛋白組學(xué)(Proteomics)的實(shí)質(zhì)就是分析和解讀核酸和蛋白質(zhì)序列中所表達(dá)的結(jié)構(gòu)與功能的生物信息.這方面的研究已成為生物信息學(xué)的主要研究?jī)?nèi)容之一.一種生物的全部遺傳構(gòu)成被稱為該種生物的基因組.有關(guān)基因組的研究稱為基因組學(xué).其中, 序列基因組學(xué)(Sequence genomics)主要研究測(cè)序和核苷酸序列;結(jié)構(gòu)基因組學(xué)(Structural genomics)著重于遺傳圖譜、物理圖譜和測(cè)序等方面的研究;功能基因組學(xué)
(Functional genomics)則研究以轉(zhuǎn)錄圖為基礎(chǔ)的基因組表達(dá)圖譜;比較基因組學(xué)(Comparative ge2nomics)的研究?jī)?nèi)容包括對(duì)不同進(jìn)化階段基因組的比較和不同種群和群體基因組的比較。
蛋白組和蛋白組學(xué)的概念是隨基因組和基因組學(xué)的出現(xiàn)而出現(xiàn)的.蛋白組(proteme)的概念是由于基因表達(dá)水平并不能代表細(xì)胞中活性蛋白質(zhì)的數(shù)量, 基因組序列并不能描述活性蛋白質(zhì)所必需的翻譯后修飾和反映蛋白質(zhì)種類和含量的動(dòng)態(tài)變化過程而提出的.在一定條件下某一基因組蛋白質(zhì)表達(dá)的數(shù)量類型稱為蛋白組, 代表這一有機(jī)體全部蛋白質(zhì)組成及其作用方式.有關(guān)蛋白組的研究稱為蛋白組學(xué).其中, 蛋白組的研究技術(shù)與方法、雙向凝膠電泳圖譜以及對(duì)不同條件下蛋白組變化的比較分析是蛋白組學(xué)的主要研究?jī)?nèi)容。生物信息學(xué)在基因組和蛋白組研究中所起的作用主要有:(1)基因組信息結(jié)構(gòu)的計(jì)算分析.即對(duì)基因組數(shù)據(jù)進(jìn)行大規(guī)模并行計(jì)算并預(yù)測(cè)各種新基因和功能位點(diǎn), 研究大量非編碼區(qū)序列的信息結(jié)構(gòu)和可能的生物學(xué)意義。(2)模式生物全基因組信息結(jié)構(gòu)的比較研究.即
對(duì)已完成全基因組測(cè)序的各種模式生物的基因組信息結(jié)構(gòu)進(jìn)行比較分析, 包括同源序列的搜索比較和指導(dǎo)基因克隆.(3)功能基因組的相關(guān)信息分析, 包括對(duì)基因表達(dá)圖譜及其相關(guān)算法和軟件的研究, 與功能基因組信息相關(guān)的核酸、蛋白質(zhì)的空間結(jié)構(gòu)的預(yù)測(cè)模擬以及蛋白質(zhì)的功能預(yù)測(cè)。
2、生物信息數(shù)據(jù)庫(kù)
復(fù)雜的生物和生物界和日新月異的生命科學(xué)研究產(chǎn)出的大量的生物學(xué)信息,對(duì)這些信息的儲(chǔ)存、檢索、比較分析必須借助于計(jì)算機(jī)數(shù)據(jù)庫(kù)技術(shù), 包括各類生物學(xué)信息數(shù)據(jù)庫(kù)的建立與維護(hù)、數(shù)據(jù)的添加與注釋、更新與查詢、數(shù)據(jù)庫(kù)資料的網(wǎng)絡(luò)化等研究?jī)?nèi)容?,F(xiàn)有的數(shù)據(jù)庫(kù)有:核酸序列數(shù)據(jù)庫(kù)(GenBank、EMBL、DDBJ)、基因組數(shù)據(jù)庫(kù)、基因圖譜數(shù)據(jù)庫(kù)、蛋白質(zhì)序列數(shù)據(jù)庫(kù)(SWTSS-
PROT、PIR)和蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)(Interpro)等。隨著生命科學(xué)的不斷發(fā)展,數(shù)據(jù)庫(kù)種類不斷增加、結(jié)構(gòu)日益復(fù)雜、使用也越來越方便。
生物信息學(xué)作為一門新興學(xué)科已經(jīng)成為生命科學(xué)研究中必不可少的研究手段 本文對(duì)數(shù)據(jù)庫(kù)與數(shù)據(jù)庫(kù)搜索序列比對(duì)蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)藥物設(shè)計(jì)基因芯片技術(shù)幾個(gè)方面做了介紹較為系統(tǒng)地闡述了生物信息學(xué)在這些領(lǐng)域的應(yīng)用 當(dāng)然它所涉及的內(nèi)容與方法遠(yuǎn)遠(yuǎn)不只上面提到的那些 新基因和 的發(fā)現(xiàn)與鑒定非編碼區(qū)信息結(jié)構(gòu)分析遺傳密碼的起源和生物進(jìn)化完整基因組的比較
研究 大規(guī)?;蚬δ鼙磉_(dá)譜的分析等都是生物信息學(xué)研究的對(duì)象 相信不久的將來生物信息學(xué)會(huì)在生命
科學(xué)領(lǐng)域扮演越來越重要的角色。
參考文獻(xiàn):
1、現(xiàn)代生物信息學(xué)及其主要研究領(lǐng)域 蕭浪濤(湖南農(nóng)業(yè)大學(xué)理學(xué)院, 湖南長(zhǎng)沙 410128)
2、生物信息學(xué)技術(shù)進(jìn)展 郭志云 張懷渝 梁龍 軍事醫(yī)學(xué)科學(xué)院 生物工程研究所,北京100071;四川農(nóng)業(yè)大學(xué)生命科學(xué)及理學(xué)院,雅安 6250143、利用生物信息學(xué)技術(shù)研究蛋白功能的幾種方法 王劍利 楊章民綜述 王一理審閱 西安交通大學(xué)醫(yī)學(xué)院免疫病理學(xué)研究室(西安, 710061)
第四篇:生物信息學(xué)研究進(jìn)展
我國(guó)生物信息學(xué)發(fā)展現(xiàn)狀及展望
摘要:簡(jiǎn)要敘述了我國(guó)生物信息學(xué)發(fā)展現(xiàn)狀,以及我國(guó)當(dāng)前生物信息學(xué)發(fā)展中的一些問題,并對(duì)生物信息學(xué)的發(fā)展前景進(jìn)行概述。
關(guān)鍵詞:生物信息學(xué) 現(xiàn)狀 展望
1生物信息學(xué)簡(jiǎn)介
生物信息學(xué)(Bioinformatics)是20世紀(jì)末才誕生的一門新學(xué)科,是信息技術(shù)在生物數(shù)據(jù)處理上的應(yīng)用,該學(xué)科涉及分子生物學(xué)技術(shù)、計(jì)算機(jī)信息技術(shù)、數(shù)據(jù)庫(kù)技術(shù)等多門學(xué)科,是生物學(xué)、數(shù)學(xué)、物理學(xué)、計(jì)算機(jī)科學(xué)等眾多學(xué)科交叉的新興學(xué)科。它主要利用計(jì)算機(jī)信息處理工具和軟件對(duì)分子生物學(xué)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行加工和分析,從中發(fā)現(xiàn)有價(jià)值的信息,它是生命科學(xué)的前沿學(xué)科,其數(shù)據(jù)信息主要來自于人類及各種模式生物基因組的分子數(shù)據(jù),包括DNA、RNA和蛋白質(zhì)片斷的序列數(shù)據(jù),也有蛋白質(zhì)的結(jié)構(gòu)數(shù)據(jù)和經(jīng)過計(jì)算機(jī)處理的分子數(shù)據(jù)。
2國(guó)內(nèi)生物信息學(xué)發(fā)展?fàn)顩r
我國(guó)生物信息學(xué)研究近年來發(fā)展較快,相繼成立了北京大學(xué)生物信息學(xué)中心、華大基因組信息學(xué)研究中心、中國(guó)科學(xué)院上海生命科學(xué)院生物信息中心,部分高校已經(jīng)或準(zhǔn)備開設(shè)生物信息學(xué)專業(yè)。2002年國(guó)家自然科學(xué)基金委在生物化學(xué)、生物物理學(xué)與生物醫(yī)學(xué)工程學(xué)學(xué)科設(shè)立了生物信息學(xué)項(xiàng)目,并列入生命科學(xué)部?jī)?yōu)先資助的研究項(xiàng)目。國(guó)家 863計(jì)劃特別設(shè)立了生物信息技術(shù)主題,從國(guó)家需求的層面上推動(dòng)我國(guó)生物信息技術(shù)的大力發(fā)展。
但是由于起步較晚及諸多原因,我國(guó)的生物信息學(xué)發(fā)展水平遠(yuǎn)遠(yuǎn)落后于國(guó)外。在PubMed收錄的以關(guān)鍵詞“Bioinformatics”檢索到的歷年發(fā)表的文章數(shù),可以看出大量的研究文獻(xiàn)出現(xiàn)在21世紀(jì)以后。其中我國(guó)共有138篇占全部5548篇的2.5%,而美國(guó)則發(fā)表2160篇占全部的39%之多(統(tǒng)計(jì)數(shù)據(jù)截至2004年2月15日)。我國(guó)學(xué)者在生物信息學(xué)領(lǐng)域發(fā)表的有高影響力的論文只有不到美國(guó)學(xué)者發(fā)表數(shù)量的6%,差距相當(dāng)大。在生物信息學(xué)領(lǐng)域,一些著名院士和教授在各自領(lǐng)域取得了一定成績(jī),顯露出蓬勃發(fā)展的勢(shì)頭,有的在國(guó)際上還占有一席之地。如北京大學(xué)的羅靜初和顧孝誠(chéng)教授在生物信息學(xué)網(wǎng)站建設(shè)方面、中科院生物物理所的陳潤(rùn)生研究員在EST序列拼接方面以及在基因組演化方面、天津大學(xué)的張春霆院士在DNA序列的幾何學(xué)分析方面、中科院理論物理所郝柏林院士、清華大學(xué)的李衍達(dá)院士和孫之榮教授、內(nèi)蒙古大學(xué)的羅遼復(fù)教授、上海的丁達(dá)夫教授等等。北京大學(xué)于1997年3月成立了生物信息學(xué)中心,這個(gè)中心在1996年歐洲EMBNet擴(kuò)大到歐洲之外時(shí)已正式成為中國(guó)結(jié)點(diǎn)(每個(gè)國(guó)家只有一個(gè)結(jié)點(diǎn)),目前已有60多種生物數(shù)據(jù)庫(kù)的經(jīng)常更新的鏡像點(diǎn)。近年來,它已組織過多次國(guó)內(nèi)和地區(qū)的培訓(xùn)班及會(huì)議,有著較廣泛的國(guó)際聯(lián)系。另外,中國(guó)科學(xué)院、中國(guó)醫(yī)學(xué)科學(xué)院、軍事醫(yī)學(xué)科學(xué)院、清華大學(xué)、天津大學(xué)、浙江大學(xué)、復(fù)旦大學(xué)、哈爾濱工業(yè)大學(xué)、東南大學(xué)、中山大學(xué)、內(nèi)蒙古大學(xué)等等都先后開展了生物信息學(xué)研究和教學(xué)工作,許多大學(xué)都設(shè)立了生物信息學(xué)專業(yè),并同時(shí)招收本科、碩士、博士研究生。
各種學(xué)術(shù)會(huì)議及論壇的召開,對(duì)于促進(jìn)我國(guó)在這一前沿領(lǐng)域的發(fā)展起著越來越重要的作用。中國(guó)科學(xué)院于1997年9月和12月召開了第80、87次香山會(huì)議,首次邀請(qǐng)有關(guān)專家就“DNA芯片的現(xiàn)狀與未來”和“生物信息學(xué)”進(jìn)行探討。1999年3月,清華大學(xué)生物信息學(xué)研究所、國(guó)家人類基因組北方研究中心和北京生物技術(shù)和新醫(yī)藥產(chǎn)業(yè)促進(jìn)中心共同舉辦了“北方生物信息學(xué)學(xué)術(shù)研討會(huì)”。1999年4月,北京大學(xué)舉辦了“國(guó)際生物信息學(xué)講習(xí)班”。2001年4月,由北京市科技委員會(huì)、中國(guó)人類基因組北方研究中心、中國(guó)人類基因組南方研究中心、北京華大基因研究中心、軍事醫(yī)學(xué)科學(xué)院、北京生物工程學(xué)會(huì)生物信息學(xué)專業(yè)委
員會(huì)、北京生物技術(shù)和新醫(yī)藥產(chǎn)業(yè)促進(jìn)中心等共同舉辦的首屆“中國(guó)生物信息學(xué)大會(huì)”在北京召開。2003年11月28-29日,中國(guó)科協(xié)“生物信息學(xué)與進(jìn)化計(jì)算”第81次青年科學(xué)家論壇在北京中國(guó)科技會(huì)堂成功召開。這次論壇是中國(guó)科協(xié)舉辦的一次多學(xué)科交叉的盛會(huì),旨在促進(jìn)國(guó)內(nèi)青年科學(xué)家在這一全新領(lǐng)域內(nèi)的相互交流,促進(jìn)該學(xué)科的成長(zhǎng)與發(fā)展。這是國(guó)內(nèi)首次以“生物信息學(xué)”為主題的一次多學(xué)科交叉的青年科學(xué)家論壇。與會(huì)者一致認(rèn)為系統(tǒng)生物學(xué)、非編碼區(qū)功能研究、基因調(diào)控和相互作用網(wǎng)絡(luò)等是當(dāng)前生物信息學(xué)研究的熱點(diǎn)問題。
盡管如此,真正開展生物信息學(xué)具體研究和服務(wù)的機(jī)構(gòu)或公司仍相對(duì)較少,僅有的幾家科研機(jī)構(gòu)主要開展生物信息學(xué)理論研究,聲稱提供生物信息學(xué)服務(wù)的公司所提供的服務(wù)也僅局限于簡(jiǎn)單的計(jì)算機(jī)輔助分子生物學(xué)實(shí)驗(yàn)設(shè)計(jì),而且服務(wù)體系并不完善;國(guó)內(nèi)互聯(lián)網(wǎng)上已有的幾家生物信息學(xué)網(wǎng)站,大部分偏于所有生物(醫(yī))學(xué)領(lǐng)域的新聞報(bào)道,而生物信息學(xué)專業(yè)技術(shù)服務(wù)的含量太少,這就與國(guó)外有了較大差距。
3我國(guó)生物信息學(xué)發(fā)展中存在的問題
一方面,在生物信息學(xué)研究領(lǐng)域,一般的教授、教師能力有限,有些甚至對(duì)生物信息學(xué)本身知其一不知其二,缺乏正規(guī)的訓(xùn)練,很少了解目前的研究重點(diǎn)、熱點(diǎn)和今后方向。由于所申請(qǐng)的經(jīng)費(fèi)支持力度和持續(xù)時(shí)間原因,大多數(shù)學(xué)者只能選擇易于獲得研究成果的科研項(xiàng)目,一般缺乏新穎性和創(chuàng)造性。這可能與我們國(guó)家處于快速發(fā)展階段的“短平快”思路和環(huán)境有關(guān)。另一方面,可能是教育體制上的原因,科研項(xiàng)目的分配問題、行政管理中存在的問題,傳統(tǒng)教育不鼓勵(lì)學(xué)生進(jìn)行批判性、創(chuàng)新性地學(xué)習(xí)和思考的問題,也可能是癥結(jié)所在。另外,生物信息學(xué)對(duì)信息交流有很高的要求,尤其是Internet的暢通,我國(guó)曾經(jīng)有人為的限制訪問或限制流量這些今后回顧時(shí)會(huì)成為苦澀消化的舉措[6]。目前我國(guó)的科研經(jīng)費(fèi)真正投入并落到實(shí)處的占國(guó)家GDP的份額還很小,科研經(jīng)費(fèi)問題進(jìn)一步限制了生物信息學(xué)在我國(guó)的發(fā)展。
4展望
生物信息學(xué)作為一門新興的工程技術(shù)學(xué)科,對(duì)剛起步的我們來說充滿了機(jī)會(huì)和挑戰(zhàn),“后基因組時(shí)代”給我國(guó)的生物信息學(xué)發(fā)展提供了很大的舞臺(tái)。生物信息學(xué)首先是一門信息學(xué),所以我們必須端正一些可能的認(rèn)識(shí)錯(cuò)誤,必須呼吁引導(dǎo)更多的計(jì)算機(jī)、數(shù)學(xué)、物理學(xué)人才加入到其中的研究。統(tǒng)計(jì)學(xué)、概率論、組合數(shù)學(xué)(尤其是圖論)、拓?fù)鋵W(xué)、運(yùn)籌學(xué)、函數(shù)論、信息學(xué)、計(jì)算數(shù)學(xué)、群論、人工智能,都已經(jīng)在生物信息學(xué)研究中發(fā)揮了巨大的作用。我們應(yīng)盡快縮小我國(guó)在計(jì)算機(jī)信息學(xué)的核心技術(shù)、巨型計(jì)算機(jī)的應(yīng)用以及互聯(lián)網(wǎng)核心技術(shù)方面與世界領(lǐng)先國(guó)家的差距。生物信息學(xué)的發(fā)展對(duì)生物學(xué)、醫(yī)學(xué)、農(nóng)業(yè)、環(huán)境科學(xué)、信息技術(shù)以及新材料的研究必將起到深刻的作用,生物信息學(xué)進(jìn)一步深入研究和廣泛應(yīng)用必將為這些領(lǐng)域帶來根本性的變革。生物信息學(xué)的特點(diǎn)是投資少,見效快,效益大,適合于我國(guó)的現(xiàn)實(shí)條件。即從英特網(wǎng)上源源不斷地采集數(shù)據(jù),進(jìn)行分析、歸類與重組,發(fā)現(xiàn)新線索、新現(xiàn)象和新規(guī)律,用以指導(dǎo)實(shí)驗(yàn)工作的設(shè)計(jì),這是一條既快又省的科研路線,可避免不必要的重復(fù),少走彎路,提高我國(guó)生物科學(xué)的研究水平。
第五篇:生物信息學(xué)參考書目
生物信息學(xué)-國(guó)內(nèi)外書目
1.Bioinformatics: sequence and genome analysis,影印本,David W.Mount,科學(xué)出版社,2002
2.DNA芯片和基因表達(dá):從實(shí)驗(yàn)到數(shù)據(jù)分析與模建,鮑爾迪,科學(xué)出版社,2003
3.分子進(jìn)化與系統(tǒng)發(fā)育,MasatoshiNei(根井正利)SudhirKumar.譯者:呂寶忠,鐘揚(yáng),高莉萍,高等教育出版社,2002
4.蛋白質(zhì)化學(xué)與蛋白質(zhì)組學(xué),夏其昌,科學(xué)出版社,2004年
5.蛋白質(zhì)組學(xué):從序列到功能,錢小紅、賀福初等譯科學(xué)出版社,2002年9月
6.蛋白質(zhì)組學(xué):理論與方法,錢小紅,賀福初主編.科學(xué)出版社,2003
7.蛋白質(zhì)組學(xué)導(dǎo)論:生物學(xué)的新工具,(美)利布萊爾,科學(xué)出版社,2005
8.蛋白質(zhì)組學(xué)導(dǎo)論:生物學(xué)的新工具,張繼仁(譯)科學(xué)出版社,2004年12月出版
9.后基因組信息學(xué),MinoruKanehisa著;孫之榮等譯,清華大學(xué)出版社,2002
10.基礎(chǔ)生物信息學(xué)及應(yīng)用,蔣彥等編清華大學(xué)出版社,科學(xué)出版社,2003
11.基因VⅢ,盧因,科學(xué)出版社,2005
12.基因表達(dá)序列標(biāo)簽(EST)數(shù)據(jù)分析手冊(cè),胡松年,浙江大學(xué)出版社,2005
13.基因組,袁建剛等主譯科學(xué)出版社,2002
14.基因組數(shù)據(jù)分析手冊(cè),胡松年,薛慶中主編,浙江大學(xué)出版社,2003
15.基因組研究與生物信息學(xué)
16.基因組研究與生物信息學(xué),李越中閆章才高培基,山東大學(xué)出版社,2003
17.基于004km.cnputing
Author(s): Bryan P.Bergeron
52.Genetics Databases
Author(s): M.J.Bishop
53.Structural Bioinformatics
Author(s): Philip E.Bourne, Helge Weissig
54.Computational Modeling of Genetic and Biochemical Networks
Author(s): James M.Bower and Hamid Bolouri
55.Bioinformatics: A Biologist's Guide to Biocomputing and the Internet
Author(s): Stuart M.Brown
56.Discovering Genomics, Proteomics, and Bioinformatics
Author(s): A.Malcolm Campbell, Laurie J.Heyer
57.Bioinformatics for Dummies
Author(s): Jean-Michel Claverie and Cedric Notredame
58.Computational Molecular Biology: An Introduction
Author(s): Peter Clote, Rolf Backofen
59.Nonlinear Estimation and Classification
Author(s): D.D.Denison, M.H.Hansen, C.C.Holmes, B.Mallick & B.Yu(Eds.)
60.Author(s): Richard Durbin, Sean R.Eddy, Anders Krogh, Graeme Mitchison
61.Genomic Perl: From Bioinformatics Basics to Working Code
Author(s): Rex A.Dwyer
62.Protein Bioinformatics: An Algorithmic Approach to Sequence and Structure Analysis Author(s): Ingvar Eidhammer, Inge Jonassen, William R.T.Taylor
63.Computational Cell Biology
Author(s): Christopher P.Fall, Eric S.Marland, John M.Wagner and John J.Tyson, Editors
64.Evolutionary Computation in Bioinformatics
Author(s): Gary B.Fogel, David W.Corne
65.Developing Bioinformatics Computer Skills
Author(s): Cynthia Gibas, Per Jambeck
66.Statistical Methods in Bioinformatics: An Introduction
Author(s): Gregory R.Grant, Warren J.Ewens
67.Algorithms on Strings, Trees and Sequences
Author(s): Dan Gusfield
68.Bioinformatics : Sequence, Structure, and Databanks : A Practical Approach
Author(s): Des Higgins(Editor), Willie Taylor(Editor)
69.Post-genome Informatics
Author(s): Minoru Kanehisa
70.Foundations of Systems Biology
Author(s): Hiroaki Kitano
71.Guide to Analysis of DNA Microarray Data
72.Microarrays for an Integrative Genomics
Author(s): Isaac S.Kohane, Alvin Kho, Atul J.Butte
73.BLAST
Author(s): Ian Korf, Mark Yandell, Joseph Bedell
74.Hidden Markov Models for Bioinformatics
Author(s): Timo Koski
75.Fundamental Concepts of Bioinformatics
Author(s): Dan E.Krane, Michael L.Raymer
76.Advances in Molecular Bioinformatics
Author(s): Steffen Schulze-Kremer(Editor)
77.Molecular Bioinformatics: Algorithms and Applications
Author(s): Steffen Schulze-Kremer
78.Computational Biology
Author(s): Lecture Notes in Computer Science, Vol.2066
79.Analysis of Microarray Gene Expression Datas
Author(s): Mei-Ling Ting Lee
80.Bioinformatics: From Genomes to Drugs
Author(s): Thomas Lengauer
81.Sequence Analysis in a Nutshell: A Guide to Common Tools and Databases
Author(s): Darryl Le?n, Scott Markel
82.Introduction to Bioinformatics
Author(s): Arthur M.Lesk
83.Computational Molecular Biology
Author(s): J.Leszczynski
84.Bioinformatics: Databases and Systems
Author(s): Stanley Letovsky(Editor)
85.Computational Cell Biology
Author(s): Eric Marland, John Wagner, John Tyson
86.Bioinformatics and Genome Analysis
Author(s): H.W.Mewes, B.Weiss, H.Seidel
87.Bioinformatics: Methods and Protocols
Author(s): Stephen Misener(Editor), Stephen A.Krawetz(Editor)
88.Bioinformatics: Sequence and Genome Analysis
Author(s): David W.Mount
89.Bioinformatics: Genes, proteins and computers
Author(s): C.A.Orengo, D.T.Jones and J.M.Thornton
90.Mathematics of Genome Analysis
91.Computational Molecular Biology: An Algorithmic Approach
Author(s): Pavel A.Pevzner
92.Bioinformatics Basics Applications in Biological Science and Medicine
Author(s): Hooman H.Rashidi, Lukas K.Buehler
93.The Phylogenetic Handbook: A Practical Approach to DNA and Protein Phylogeny
Edited by Marco Salemi, Anne-Mieke Vandamme
94.Computational Methods in Molecular Biology
Author(s): S.L.Salzberg, D.B.Searls, S.Kasif
95.Comparative Genomics: Empirical and Analytical Approaches to Gene Order Dynamics, Map Alignment and the Evolution of Gene Families
Author(s): David Sankoff, Joseph H.Nadeau
96.Molecular Modeling and Simulation: An Interdisciplinary Guide
Author(s): Tamar Schlick
97.Bioinformatics: From Nucleic Acids and Proteins to Cell Metabolism
Author(s): Dietmar Schomburg(Editor), Uta Lessel(Editor)
98.Introduction to Computational Molecular Biology
Author(s): Joao Carlos Setubal, Joao Meidanis, Jooao Carlos Setubal
99.Likelihood, Bayesian and MCMC Methods in Quantitative Genetics
Author(s): Daniel Sorensen, Daniel Gianola
100.Microarray Bioinformatics
Author(s): Dov Stekel
101.Protein Structure PredictionTools, Techniques, and Applications
Author(s): Jason T.L.Wang, Bruce A.Shapiro, and Dennis Shasha
107.Introduction to Computational Biology: Maps, Sequences and Genomes
Author(s): Michael S Waterman
108.Instant Notes Bioinformatics
Author(s): D.R.Westhead, J.H.Parish, R.M.Twyman
Author(s): Limsoon Wong
110.Neural Networks and Genome Informatics
Author(s): Cathy H.Wu, Jerry W.McLarty
111.Intelligent Bioinformatics: The Application of Artificial Intelligence Techniques to Bioinformatics Problems
Author(s): Edward Keedwell, Ajit Narayanan
112.Jonathan Pevsner,Bioinformatics and Functional Genomics,John Wiley & Sons, Inc,2003