第一篇:生物信息學(xué)考試重點(diǎn)
1.生物信息學(xué):生物信息學(xué)包含了生物信息的獲取、處理、分析、和解釋等在內(nèi)的一門(mén)交
叉學(xué)科;它綜合運(yùn)用了數(shù)學(xué)、計(jì)算機(jī)學(xué)和生物學(xué)的各種工具來(lái)進(jìn)行研究;目的在于闡明大量生物學(xué)數(shù)據(jù)所包含的生物學(xué)意義。
2.BLAST直譯:基本局部排比搜索工具意譯:基于局部序列排比的常用數(shù)據(jù)庫(kù)搜索工
具含義:蛋白質(zhì)和核酸序列數(shù)據(jù)庫(kù)搜索軟件系統(tǒng)及相關(guān)數(shù)據(jù)庫(kù)
3.PSI-BLAST:是一種迭代的搜索方法,可以提高BLAST和FASTA的相似序列發(fā)現(xiàn)率。
4.一致序列:這些序列是指把多序列聯(lián)配的信息壓縮至單條序列,主要的缺點(diǎn)是除了在特
定位置最常見(jiàn)的殘基之外,它們不能表示任何概率信息。
5.HMM隱馬爾可夫模型:是蛋白質(zhì)結(jié)構(gòu)域家族序列的一種嚴(yán)格的統(tǒng)計(jì)模型,包括序列的匹
配,插入和缺失狀態(tài),并根據(jù)每種狀態(tài)的概率分布和狀態(tài)間的相互轉(zhuǎn)換來(lái)生成蛋白質(zhì)序列。
6.信息位點(diǎn):由位點(diǎn)產(chǎn)生的突變數(shù)目把其中的一課樹(shù)與其他樹(shù)區(qū)分開(kāi)的位點(diǎn)。
7.非信息位點(diǎn):對(duì)于最大簡(jiǎn)約法來(lái)說(shuō)沒(méi)有意義的點(diǎn)。
8.標(biāo)度樹(shù):分支長(zhǎng)度與相鄰節(jié)點(diǎn)對(duì)的差異程度成正比的樹(shù)。
9.非標(biāo)度樹(shù):只表示親緣關(guān)系無(wú)差異程度信息。
10.有根樹(shù):?jiǎn)我坏墓?jié)點(diǎn)能指派為共同的祖先,從祖先節(jié)點(diǎn)只有唯一的路徑歷經(jīng)進(jìn)化到達(dá)其
他任何節(jié)點(diǎn)。
11.無(wú)根樹(shù):只表明節(jié)點(diǎn)間的關(guān)系,無(wú)進(jìn)化發(fā)生方向的信息,通過(guò)引入外群或外部參考物種,可以在無(wú)根樹(shù)中指派根節(jié)點(diǎn)。
12.注釋:指從原始序列數(shù)據(jù)中獲得有用的生物學(xué)信息。這主要是指在基因組DNA中尋找基
因和其他功能元件(結(jié)構(gòu)注釋),并給出這些序列的功能(功能注釋)。
13.聚類分析:一種通過(guò)將相似的數(shù)據(jù)劃分到特定的組中以簡(jiǎn)化大規(guī)模數(shù)據(jù)集的方法。
14.ESI電噴霧離子化:一種適合大分子如蛋白質(zhì)離子化沒(méi)有明顯降解的質(zhì)譜技術(shù)。樣品溶
解后從高電壓控制下的細(xì)針中噴出,形成的帶電荷微小液滴從一個(gè)小孔直接進(jìn)入質(zhì)譜儀的真空室中,在其鐘被一股惰性氣體干燥形成氣態(tài)離子,這些氣態(tài)離子從分析儀向探測(cè)器加速(飛行)。
15.機(jī)制輔助的激光解析/離子化(MAIDI):這一技術(shù)通過(guò)質(zhì)譜產(chǎn)生離子,這適合于沒(méi)有降
解的大蛋白質(zhì)的分析?;驹硎菍⒎治鑫锓稚⒃跈C(jī)制分子中并形成晶體,當(dāng)用激光照射晶體時(shí),基質(zhì)分子吸收激光能量,樣品解吸附,基質(zhì)-樣品之間發(fā)生電荷轉(zhuǎn)移使樣品電子分離。
16.質(zhì)譜(MS):是一種準(zhǔn)確測(cè)定真空中離子的分子質(zhì)量/電荷比(m/z)的方法,從而使分子質(zhì)
量的準(zhǔn)確確定成為可能?;驹恚簩⒎治鑫锓稚⒃诨|(zhì)分子中并形成晶體,當(dāng)用激光照射晶體時(shí),基質(zhì)分子吸收激光能量,樣品解吸附,基質(zhì)—樣品之間發(fā)生電荷轉(zhuǎn)移使樣品分子電離。
17.微陣列芯片:將探針有規(guī)律地排列固定于載體上,與標(biāo)記熒光分子的樣品進(jìn)行雜交,通
過(guò)掃描儀掃描對(duì)熒光信號(hào)的強(qiáng)度進(jìn)行檢測(cè),從而迅速得出所要的信息。
18.虛擬消化:是在已知蛋白質(zhì)序列和蛋白外切酶之類切斷試劑的已知特異性的基礎(chǔ)上,由
計(jì)算機(jī)進(jìn)行的一種理論上的蛋白裂解反應(yīng)。
19.分子途徑是指一組連續(xù)起作用以達(dá)到共同目標(biāo)的蛋白質(zhì)。
20.虛擬細(xì)胞:一種建模手段,把細(xì)胞定義為許多結(jié)構(gòu),分子,反應(yīng)和物質(zhì)流的集合體。
21.先導(dǎo)化合物:是指具有一定藥理活性的、可通過(guò)結(jié)構(gòu)改造來(lái)優(yōu)化其藥理特性而可能導(dǎo)致
藥物發(fā)現(xiàn)的特殊化合物。就是利用計(jì)算機(jī)在含有大量化合物三維結(jié)構(gòu)的數(shù)據(jù)庫(kù)中,搜索能與生物大分子靶點(diǎn)匹配的化合物,或者搜索能與結(jié)合藥效團(tuán)相符的化合物,又稱原型物,簡(jiǎn)稱先導(dǎo)物,是通過(guò)各種途徑或方法得到的具有生物活性的化學(xué)結(jié)構(gòu)
22.權(quán)重矩陣(序列輪廓):是一種描繪蛋白質(zhì)結(jié)構(gòu)域家族相序列的方法。它們表示完全
結(jié)構(gòu)域序列,多序列聯(lián)配中每個(gè)位點(diǎn)的氨基酸都有分值,并且特定位置插入或缺失的可能性均有一定的衡量方法。(課件定義)基礎(chǔ)上針對(duì)特定的應(yīng)用目標(biāo)而建立的數(shù)據(jù)庫(kù)。
23.系統(tǒng)發(fā)育學(xué)(phylogenetic):確定生物體間進(jìn)化關(guān)系的科學(xué)分支。
24.系統(tǒng)生物學(xué)(systems biology):是研究一個(gè)生物系統(tǒng)中所有組分成分(基因、mRNA、蛋白質(zhì)等)的構(gòu)成以及在特定條件下這些組分間的相互關(guān)系,并分析生物系統(tǒng)在一定時(shí)間內(nèi)的動(dòng)力學(xué)過(guò)程
25.蛋白質(zhì)組(proteome):是指一個(gè)基因組、一種生物或一個(gè)細(xì)胞/組織的基因組所表達(dá)的全套蛋白質(zhì)。
26.進(jìn)化樹(shù):物種的進(jìn)化被表現(xiàn)成為一系列的分叉,并符合分類理論,這些樹(shù)就叫做進(jìn)化樹(shù)。
27.DBGET/LinkDB:由日本的化學(xué)研究所和人類基因組中心所開(kāi)發(fā)的在線數(shù)據(jù)檢索工具。
也見(jiàn)Entrez,SRS。
28.肽指紋圖譜:蛋白質(zhì)注釋的一種方法,用質(zhì)譜技術(shù)確定肽分子量(由蛋白酶消化產(chǎn)生)
并用來(lái)搜索蛋白質(zhì)數(shù)據(jù)庫(kù)找到與“虛擬消化”蛋白質(zhì)相匹配項(xiàng)。
29.E值:對(duì)某個(gè)已識(shí)別出的相似度值S,E值是分值大于等于S的期望頻率,改值可以被
理解為期望隨機(jī)得到等于S或大于S值的分值數(shù)目。
30.相似度表和距離表:使顯示物種間一套選定字符的相關(guān)性的表格,采用匹配的百分比(相
似度表)或者差異的百分比(距離表)來(lái)表示。
31.無(wú)監(jiān)督分析法:這種方法沒(méi)有內(nèi)建的分類標(biāo)準(zhǔn),組的數(shù)目和類型只決定于所使用的算法
和數(shù)據(jù)本身的分析方法。有監(jiān)督分析法:這種方法引入某些形式的分類系統(tǒng),從而將表達(dá)模式分配到一個(gè)或多個(gè)預(yù)定義的類目中。
32.距離矩陣法:首先通過(guò)各個(gè)物種之間的比較,根據(jù)一定的假設(shè)(進(jìn)化距離模型)推到得
出分類群之間的進(jìn)化距離,構(gòu)建一個(gè)進(jìn)化距離矩陣,其次基于這個(gè)矩陣中的進(jìn)化距離關(guān)系構(gòu)建進(jìn)化樹(shù);最大簡(jiǎn)約法:該法依據(jù)在任何位置將一條序列轉(zhuǎn)變成另一條序列所需要突變的最少數(shù)量對(duì)序列進(jìn)行比較和聚類;最大似然法:該模型可將一個(gè)給定替代發(fā)生在序列中任何位置的概率融合進(jìn)算法,該方法計(jì)算序列中每個(gè)位置的一個(gè)給定序列變化的可能性,最可靠的樹(shù)為總的可能性最大的那棵。
33.一級(jí)數(shù)據(jù)庫(kù):數(shù)據(jù)庫(kù)中的數(shù)據(jù)直接來(lái)源于實(shí)驗(yàn)獲得的原始數(shù)據(jù),只經(jīng)過(guò)簡(jiǎn)單的歸類整理
和注釋; 二級(jí)數(shù)據(jù)庫(kù):對(duì)原始生物分子數(shù)據(jù)進(jìn)行整理、分類的結(jié)果,即非原始的實(shí)驗(yàn)數(shù)據(jù),是在一級(jí)數(shù)據(jù)庫(kù)、實(shí)驗(yàn)數(shù)據(jù)和理論分析的基礎(chǔ)上針對(duì)特定的應(yīng)用目標(biāo)而建立的。
1.常用的三種序列格式:NBRF/PIR,FASTA和GDE
2.三個(gè)核算序列數(shù)據(jù)庫(kù):GenBank,EMBL和DDBJ
3.蛋白質(zhì)序列數(shù)據(jù)庫(kù):SWISS-PROT和TrEMBL
4.提供蛋白質(zhì)功能注釋信息的數(shù)據(jù)庫(kù):KEGG(京都基因和基因組百科全書(shū))和PIR(蛋白質(zhì)信息資源)5.目前由NCBI維護(hù)的大型文獻(xiàn)資源是PubMed
6.數(shù)據(jù)庫(kù)常用的數(shù)據(jù)檢索工具:Entrez,SRS,DBGET
7.常用的序列搜索方法:FASTA和BLAST
8.高分值局部聯(lián)配的BLAST術(shù)語(yǔ)是HSPs(高分值片段對(duì)),E(期望值)
9.多序列聯(lián)配的常用軟件:Clustal10.蛋白質(zhì)結(jié)構(gòu)域家族的數(shù)據(jù)庫(kù)有:Pfam,SMART
11.系統(tǒng)發(fā)育學(xué)的研究方法有:表現(xiàn)型分類法,遺傳分類法和進(jìn)化分類法
12.系統(tǒng)發(fā)育樹(shù)的構(gòu)建方法:距離矩陣法,最大簡(jiǎn)約法和最大似然法
13.常用系統(tǒng)發(fā)育分析軟件:PHYLIP
14.檢測(cè)系統(tǒng)發(fā)育樹(shù)可靠性的技術(shù):bootstrapping和Jack-knifing
16.查找簡(jiǎn)單基因的程序:NCBI ORF finder
17.測(cè)試基因預(yù)測(cè)程序正確預(yù)測(cè)基因的能力的項(xiàng)目是GASP(基因預(yù)測(cè)評(píng)估項(xiàng)目)
18.二級(jí)結(jié)構(gòu)的三種狀態(tài):α螺旋,β折疊和β轉(zhuǎn)角
19.用于蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)的基本神經(jīng)網(wǎng)絡(luò)模型為三層的前饋網(wǎng)絡(luò),包括輸入層,隱含層和輸出層
20.通過(guò)比較建模預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)的軟件有SWISS——MODEL網(wǎng)站
21.蛋白質(zhì)質(zhì)譜數(shù)據(jù)搜索工具:SEQUEST(原理:經(jīng)試驗(yàn)確定的肽或肽片段的質(zhì)譜與數(shù)據(jù)庫(kù)中預(yù)測(cè)的質(zhì)譜進(jìn)行匹配)。22.分子途徑最廣泛數(shù)據(jù)庫(kù):KEGG
23.Entrez搜索:PubMed的文獻(xiàn)數(shù)據(jù)庫(kù)MEDLINE。SRS搜索方式:標(biāo)準(zhǔn)搜索,擴(kuò)展搜索。
1.FASTA序列格式: 第一行以“>”開(kāi)頭但并沒(méi)有指明是蛋白質(zhì)還是核酸序列。后跟代碼,接著是注釋(在同一行),通常注釋要以“|”符號(hào)相隔,第一行沒(méi)有長(zhǎng)度限制。值得注意的是FASTA文件允許以小寫(xiě)字母表示氨基酸。文件擴(kuò)展名為“.fasta”。
NBIR/PIR序列格式: 第一行以“>”開(kāi)頭,后面緊跟兩字母編碼(P1代表蛋白質(zhì)序列,N1代表核酸),再接一個(gè)分號(hào),分號(hào)后緊跟序列標(biāo)識(shí)號(hào)。后面是說(shuō)明行,該行可長(zhǎng)可短,沒(méi)有長(zhǎng)度限制。接下來(lái)是序列本身,以“*”號(hào)終止。文件的擴(kuò)展名為“.pir”或“.seq”。GDE序列格式: 與FASTA的格式基本相同,但行首為“%”,文件擴(kuò)展名為“.gde”。)
2.BLAST的五個(gè)子程序(1)Blastp,用蛋白質(zhì)查詢蛋白質(zhì)序列,可以找到具有遠(yuǎn)源進(jìn)化關(guān)系的匹配序列,方法是用待搜索蛋白序列與蛋白數(shù)據(jù)庫(kù)比較。(2)Blastn,用核苷酸 查詢核苷酸序列,適合尋找分值較高的匹配,不適合遠(yuǎn)源關(guān)系,待搜索核酸序列與核酸數(shù)據(jù)庫(kù)比較(3)Blastx,用蛋白質(zhì)查詢已翻譯核苷酸序列,適合新DNA序列和EST序列的分析,將待搜索核酸序列按6個(gè)讀框翻譯成蛋白質(zhì)序列,然后與數(shù)據(jù)庫(kù)中的蛋白質(zhì)比較。(4)Tblastn,用已翻譯核苷酸查詢蛋白質(zhì),適合尋找數(shù)據(jù)庫(kù)中尚未標(biāo)注的編碼區(qū),將數(shù)據(jù)庫(kù)中核酸序列按6個(gè)讀框翻譯成蛋白序列,然后與待搜索蛋白序列對(duì)比。(5)Tblastx,用已翻譯核苷酸查詢已翻譯核苷酸序列。適合分析EST序列,無(wú)論是待搜索核酸序列還是數(shù)據(jù)庫(kù)中核酸序列,都按6個(gè)讀框翻譯成蛋白序列。
4.PSI-Blast的原理:是一種將雙序列比對(duì)和多序列比對(duì)結(jié)合在一起的數(shù)據(jù)庫(kù)搜索方法。其主要思想是通過(guò)多次迭代找出最佳結(jié)果。每次迭代都發(fā)現(xiàn)一些中間序列,用于在接下去的迭代中尋找查詢序列的更多疏遠(yuǎn)相關(guān)序列(拓展了序列進(jìn)化關(guān)系的覆蓋面積)。具體做法是最初對(duì)查詢序列進(jìn)行BLAST搜索。接著把這次查找得到的每一擊中項(xiàng)(高于選擇的E值的選項(xiàng))作為BLAST搜索第二次迭代的查詢序列。第二次迭代應(yīng)該找到比最初查詢序列更多的進(jìn)化關(guān)系,重復(fù)(迭代)這個(gè)過(guò)程直到找不到有意義的相似序列為止。
5明該樹(shù)是可信的。第二,數(shù)據(jù)可以被重新取樣,來(lái)檢測(cè)他們系統(tǒng)上的重要性。在一種被稱為bootsrapping的技術(shù)中,數(shù)據(jù)被隨機(jī)從多序列聯(lián)配的任何位置取樣,接著被整合進(jìn)入新的人工聯(lián)配,這些聯(lián)配之后通過(guò)構(gòu)建樹(shù)來(lái)檢測(cè)。由于取樣是隨機(jī)的,一些位置可能被多次取樣,而另一些則沒(méi)由被取樣過(guò)。Jack-knifing是一種和上述相似的過(guò)程,其中50%的原始數(shù)據(jù)被重新取樣構(gòu)成一個(gè)新的矩陣,再?gòu)脑摼仃囍匦聵?gòu)建系統(tǒng)發(fā)育關(guān)系。
7. 原核生物和真核生物基因組中的注釋所涉及的不同問(wèn)題:在原核生物中,基因密度很高
(也就是說(shuō),只有很少的基因組DNA)并且絕大多數(shù)基因不含內(nèi)含子。在真核生物中,基因密度下降并且由于物種自身復(fù)雜的增高而使基因復(fù)雜度也增高。因此,在高等真核生物基因組中尋找基因可能會(huì)非常困難。
9.預(yù)測(cè)蛋白質(zhì)三級(jí)結(jié)構(gòu)的三種方法 1)同源建模法:依據(jù)蛋白質(zhì)與已知結(jié)構(gòu)蛋白比對(duì)信息構(gòu)建3D模型; 2)折疊識(shí)別法:尋找與未知蛋白最合適的模板,進(jìn)行序列與結(jié)構(gòu)比對(duì),最終建立結(jié)構(gòu)模型; 3)從頭預(yù)測(cè)法:根據(jù)序列本身從頭預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)。
11.先導(dǎo)化合物的來(lái)源有四種來(lái)源:1)通過(guò)偶然性觀察發(fā)現(xiàn)的先導(dǎo)化合物(這個(gè)方法最
著名的例子就是亞歷山大.弗萊明發(fā)現(xiàn)的青霉素,今天所用的許多抗生素皆由其發(fā)展出來(lái))
2)也可以通過(guò)替代療法的藥物開(kāi)發(fā)中發(fā)現(xiàn)的藥物副作用來(lái)識(shí)別先導(dǎo)化合物(例如,鎮(zhèn)定劑氯化物丙嫀是在試驗(yàn)中發(fā)現(xiàn)用在抗組胺劑時(shí)被發(fā)現(xiàn)的)3)先導(dǎo)化合物也可以來(lái)自傳統(tǒng)醫(yī)藥學(xué)(如奎寧化合物就來(lái)自金雞納的樹(shù)皮)4)先導(dǎo)化合物也可以來(lái)自天然的底物或是配體(比如說(shuō),腎上腺素作為舒喘寧的類似物用來(lái)治療哮喘)
12.簡(jiǎn)述DNA計(jì)算機(jī)的基本原理: 1)以編碼生命信息的遺傳物質(zhì)—DNA序列,作為信息編碼的載體,利用DNA分子的雙螺旋結(jié)構(gòu)和堿基互補(bǔ)配對(duì)的性質(zhì),將所要處理的問(wèn)題映射為特定的DNA分子;2)在生物酶的作用下,通過(guò)可控的生化反應(yīng)生成問(wèn)題的解空間;最后利用各種現(xiàn)代分子生物技術(shù)如聚合酶鏈反應(yīng)RCR、超聲波降解、親和層析、分子純化、電泳、磁珠分離等手段破獲運(yùn)算結(jié)果。.DNA計(jì)算機(jī)優(yōu)點(diǎn):低能耗、存儲(chǔ)容量高、運(yùn)算速度快,可真正實(shí)現(xiàn)并行工作。
13.簡(jiǎn)述DNA計(jì)算實(shí)現(xiàn)方式中,表面方式與試管方式相比具有哪些優(yōu)點(diǎn)?
試管方式:就是在一個(gè)或多個(gè)試管的溶液里進(jìn)行生化反應(yīng);
表面方式:是將對(duì)應(yīng)的解空間的DNA分子固定在一塊固體上,其次進(jìn)行各種生化反應(yīng),或是在表面逐步形成解空間,然后根據(jù)具體問(wèn)題對(duì)所有可能的解進(jìn)行篩選,最后得到運(yùn)算結(jié)果。優(yōu)點(diǎn):(1)操作簡(jiǎn)單,易于實(shí)現(xiàn)自動(dòng)化操作;(2)減少人為操作過(guò)程中造成的DNA分子的丟失及其它操作失誤;(3)減少分子在表面上的相互作用,同時(shí)增強(qiáng)分子間的特異性結(jié)合;(4)信息儲(chǔ)存密度大,據(jù)估計(jì),10毫克DNA表面上的儲(chǔ)存密度是傳統(tǒng)計(jì)算姬的10的8次方倍,而在溶液中僅為10的5次方倍;(5)結(jié)果易于純化。
14.簡(jiǎn)述PCR引物設(shè)計(jì)的基本原則及其注意要點(diǎn)原則:首先引物與模板的序列要緊密互補(bǔ),其次引物與引物之間避免形成穩(wěn)定的二聚體或發(fā)夾結(jié)構(gòu),再次引物不能再模板的非等位點(diǎn)引發(fā)DNA聚合反應(yīng)(即錯(cuò)配)。注意要點(diǎn):
1、引物的長(zhǎng)度一般為15-30bp,常用的是18-27bp,但不應(yīng)大于38,因?yàn)檫^(guò)長(zhǎng)會(huì)導(dǎo)致其延伸溫度大于74℃,不適合于TaqDNA聚合酶進(jìn)行反應(yīng)。
2、引物序列在模板內(nèi)應(yīng)當(dāng)沒(méi)有相似性較高,尤其是3’端相似性較高的序列,否則容易導(dǎo)致錯(cuò)配。引物3’端出現(xiàn)3個(gè)以上的連續(xù)堿基,如GGG或CCC,也會(huì)使錯(cuò)誤引發(fā)幾率增加。
3、引物3’端的末位堿基對(duì)Taq酶的DNA合成效率有較大的影響。不同的末位堿基在錯(cuò)配位置導(dǎo)致不同的擴(kuò)增效率,末位堿基為A的錯(cuò)配效率明顯高于其他3個(gè)堿基,因此應(yīng)當(dāng)避免在引物的3’端使用堿基。另外,引物二聚體或發(fā)夾結(jié)構(gòu)也可能導(dǎo)致PCR反應(yīng)失敗。5’端序列對(duì)PCR影響不太大,因此常用來(lái)引進(jìn)修飾位點(diǎn)或標(biāo)記物。
4、引物序列的GC含量一般為40-60%,過(guò)高或過(guò)低都不利于引發(fā)反應(yīng)。上下游引物的GC含量不能相差太大。
5、引物所對(duì)應(yīng)模板位置序列的Tm值在72℃左右可使復(fù)性條件最佳。Tm值的計(jì)算有很多種方法,如按公式Tm=4(G+C)+2(A+T),在Oligo軟件中使用的是最鄰近法(thenearestneighbormethod)。
6、G值是指DNA雙鏈形成所需的自由能,該值反映了雙鏈結(jié)構(gòu)內(nèi)部堿基對(duì)的相對(duì)穩(wěn)定性。應(yīng)當(dāng)選用3’端G值較低(絕對(duì)值不超過(guò)9),而在5’端和中間G值相對(duì)較高的引物。引物的3’端的G值過(guò)高,容易在錯(cuò)配位點(diǎn)形成雙鏈結(jié)構(gòu)并引發(fā)DNA聚合反應(yīng)。
7、引物二聚體及發(fā)夾結(jié)構(gòu)的能值過(guò)高(超過(guò)4.5kcal/mol)易導(dǎo)致產(chǎn)生引物二聚體帶,并且降低引物有效濃度而使PCR反應(yīng)不能正常進(jìn)行。
8、對(duì)引物的修飾一般是在5’端增加酶切位點(diǎn),應(yīng)根據(jù)下一步實(shí)驗(yàn)中要插入PCR產(chǎn)物的載體的相應(yīng)序列而確定。
15.假設(shè)你得到一段未知基因的DNA序列,從你學(xué)習(xí)到的生物信息學(xué)分析方法和軟件,設(shè)
計(jì)一個(gè)分析流程來(lái)分析該未知基因的功能和家族類別(包括系統(tǒng)發(fā)育樹(shù)構(gòu)建)
1、得到未知基因的DNA序列,用Blast做序列比對(duì),找出與其基因相似的核苷酸序列和蛋白質(zhì)序列。
2、接著,用搜索出來(lái)的較相似的序列用ClustW進(jìn)行多序列比對(duì),得到該序列的保守情況和突變情況。
3、最后用距離法構(gòu)建系統(tǒng)發(fā)育樹(shù)。
16.假設(shè)你得到一段未知蛋白的氨基酸序列,從你學(xué)習(xí)到的生物信息學(xué)分析方法和軟件,設(shè)計(jì)一個(gè)分析流程來(lái)分析該未知蛋白的功能和家族類別以及其結(jié)構(gòu)預(yù)測(cè)。
1、用該序列進(jìn)行BLASTP搜索。
2、再對(duì)其進(jìn)行蛋白質(zhì)結(jié)構(gòu)域、功能域的搜索,可以用Znterproscan、Pfam,并對(duì)其進(jìn)行結(jié)構(gòu)分析。
3、再用ClustW進(jìn)行多序列比對(duì)。
4、用人工神經(jīng)網(wǎng)絡(luò)的方法對(duì)其結(jié)構(gòu)進(jìn)行結(jié)構(gòu)預(yù)測(cè)。
5.多序列聯(lián)配的意義:
1)分析多個(gè)序列的一致序列;2)用于進(jìn)化分析,是用系統(tǒng)發(fā)育方法構(gòu)建進(jìn)化樹(shù)的初始步驟;
3)尋找個(gè)體間單核苷酸多態(tài)性;4)通過(guò)序列比對(duì)發(fā)現(xiàn)直親同源與旁系同源基因;5)尋找同源基因(相似的序列往往具有同源性);6)尋找蛋白家族識(shí)別多個(gè)序列的保守區(qū)域;7)相似的蛋白序列往往具有相似的結(jié)構(gòu)與功能;8)輔助預(yù)測(cè)新序列的二級(jí)或三級(jí)結(jié)構(gòu);9)可以直觀地看到基因的哪些區(qū)域?qū)ν蛔兠舾校?0)PCR引物設(shè)計(jì)。
6.系統(tǒng)發(fā)育學(xué)的研究方法: 1)表現(xiàn)型分類法:將表型相像的物種歸類在一起,所有特征都要被考慮到; 2)遺傳分類法:具有共有起源的物種歸類在一起,也就是說(shuō),這些字符并沒(méi)有出現(xiàn)在離它們較遠(yuǎn)的祖先序列; 3)進(jìn)化分類法:該方法綜合了表現(xiàn)型分類法和遺傳分類法的原理,進(jìn)化方法被普遍認(rèn)為是最好的系統(tǒng)發(fā)育分析方法,因?yàn)樵摲椒ǔ姓J(rèn)并采用目前的進(jìn)化理論;
8.簡(jiǎn)述人工神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)蛋白質(zhì)二級(jí)結(jié)構(gòu)的基本步驟。
(1)輸入數(shù)據(jù)(來(lái)自PDB)(2)產(chǎn)生一個(gè)神經(jīng)網(wǎng)絡(luò)(一個(gè)計(jì)算程序)(3)用已知的蛋白質(zhì)二級(jí)結(jié)構(gòu)來(lái)訓(xùn)練這個(gè)模型(4)由訓(xùn)練好的模型來(lái)給出未知蛋白的一個(gè)可能的結(jié)構(gòu)
(5)最后從生物角度來(lái)檢驗(yàn)預(yù)測(cè)的一系列氨基酸是否合理
10.分子途徑和網(wǎng)絡(luò)的特點(diǎn):(1)分子途徑和網(wǎng)絡(luò)的結(jié)構(gòu)隨意性大。圖可以很簡(jiǎn)單,也可以非常復(fù)雜。它們可能包含了多個(gè)分支,盤(pán)繞的連接和回路。(2)它們通常也顯示出節(jié)點(diǎn)間關(guān)系的方向,例如表示出代謝通路或信號(hào)傳導(dǎo)的方向。調(diào)控途徑和網(wǎng)絡(luò)的圖也應(yīng)該說(shuō)明相互作用是正的還是負(fù)的。正的相互作用(促進(jìn)或者活化作用)常常用箭頭表示,而負(fù)的交互效應(yīng)(抑制或者失活作用)常常用T型棒表示。
第二篇:生物信息學(xué)
淺談對(duì)生物信息學(xué)的認(rèn)識(shí)
摘要生物信息學(xué)是采用計(jì)算機(jī)技術(shù)和信息論方法研究蛋白質(zhì)及核酸序列等各種生物信息的采集、儲(chǔ)存、傳遞、檢索、分析和解讀的科學(xué), 是現(xiàn)代生命科學(xué)與信息科學(xué)、計(jì)算機(jī)科學(xué)、數(shù)學(xué)、統(tǒng)計(jì)學(xué)、物理學(xué)和化學(xué)等學(xué)科相互滲透而形成的交叉學(xué)科。經(jīng)過(guò)一學(xué)期的學(xué)習(xí),我學(xué)到了很多很有用的知識(shí),給我印象最深的有序列比對(duì)、蛋白質(zhì)結(jié)構(gòu)分析、核酸序列分析、數(shù)據(jù)庫(kù)及數(shù)據(jù)庫(kù)檢索等內(nèi)容。關(guān)鍵字:生物信息學(xué)認(rèn)識(shí)基因組學(xué)數(shù)據(jù)庫(kù)
時(shí)光飛逝,一學(xué)期馬上就要結(jié)束了,本學(xué)期的專業(yè)選修課也即將結(jié)束。在上課之前,我一直認(rèn)為生物信息學(xué)就是在講關(guān)于人類及動(dòng)物的基因,以及基因之間的差別。但是,剛上了幾節(jié)課,我就發(fā)現(xiàn)生物信息學(xué)根本不是我想象的那么簡(jiǎn)單,就這樣我懷著對(duì)自己的懷疑和對(duì)這門(mén)課的好奇走進(jìn)了這門(mén)課。
生物信息學(xué)是一門(mén)新興的、正在迅速發(fā)展的交叉學(xué)科,美國(guó)國(guó)家基因組研究中心認(rèn)為, 生物信息學(xué)是一個(gè)代表生物學(xué)、數(shù)學(xué)和計(jì)算機(jī)的綜合力量的新興學(xué)(Bioinformatics is an emerging scientific discipline representing the combined power of biology,mathematics, and computers)。
現(xiàn)代生物信息學(xué)是采用計(jì)算機(jī)技術(shù)和信息論方法研究蛋白質(zhì)及核酸序列等各種生物信息的采集、儲(chǔ)存、傳遞、檢索、分析和解讀的科學(xué), 是現(xiàn)代生命科學(xué)與信息科學(xué)、計(jì)算機(jī)科學(xué)、數(shù)學(xué)、統(tǒng)計(jì)學(xué)、物理學(xué)和化學(xué)等學(xué)科相互滲透而形成的交叉學(xué)科。
在這短短的一學(xué)期課中,在老師的帶領(lǐng)下,我們學(xué)到了很多關(guān)
于生物信息學(xué)的知識(shí),其中給我印象最深的有序列比對(duì)、蛋白質(zhì)結(jié)
構(gòu)分析、核酸序列分析、數(shù)據(jù)庫(kù)及數(shù)據(jù)庫(kù)檢索等內(nèi)容。
比如,序列比對(duì),它的基本問(wèn)題是比較兩個(gè)或兩個(gè)以上符號(hào)序列的相似性或不相似性。從生物學(xué)角度來(lái)看,它包含很多意義;如從
相互重疊的序列片段中重構(gòu)DNA的完整序列等。老師主要給我們介
紹了blast比對(duì)。
再如,對(duì)蛋白質(zhì)的分析。比如我們實(shí)驗(yàn)測(cè)定了一條蛋白質(zhì)序列
或者從DNA序列翻譯得來(lái)一條蛋白質(zhì)序列,我們要借助生物信息學(xué)
方法來(lái)對(duì)它進(jìn)行基本性質(zhì)及結(jié)構(gòu)分析。其中基本性質(zhì)包括它的分子
量、氨基酸數(shù)目、排列順序、等電點(diǎn)分析等。結(jié)構(gòu)分析包括跨膜螺
旋分析等。要運(yùn)用的工具是protparam tool 和TMHMM。對(duì)于這兩
個(gè)工具我都進(jìn)行了實(shí)際操作練習(xí),我覺(jué)得這對(duì)我們以后的理論學(xué)習(xí)
和實(shí)驗(yàn)分析都非常重要?,F(xiàn)代生物信息學(xué)的主要研究領(lǐng)域及其進(jìn)展
1、基因組學(xué)和蛋白組學(xué)研究
基因組和蛋白組研究是生物信息學(xué)的主要內(nèi)容.同樣, 生物信息
學(xué)是基因組和蛋白組研究中必不可少的工具。
基因組學(xué)(Genomics)和蛋白組學(xué)(Proteomics)的實(shí)質(zhì)就是分析和解讀核酸和蛋白質(zhì)序列中所表達(dá)的結(jié)構(gòu)與功能的生物信息.這方面的研究已成為生物信息學(xué)的主要研究?jī)?nèi)容之一.一種生物的全部遺傳構(gòu)成被稱為該種生物的基因組.有關(guān)基因組的研究稱為基因組學(xué).其中, 序列基因組學(xué)(Sequence genomics)主要研究測(cè)序和核苷酸序列;結(jié)構(gòu)基因組學(xué)(Structural genomics)著重于遺傳圖譜、物理圖譜和測(cè)序等方面的研究;功能基因組學(xué)
(Functional genomics)則研究以轉(zhuǎn)錄圖為基礎(chǔ)的基因組表達(dá)圖譜;比較基因組學(xué)(Comparative ge2nomics)的研究?jī)?nèi)容包括對(duì)不同進(jìn)化階段基因組的比較和不同種群和群體基因組的比較。
蛋白組和蛋白組學(xué)的概念是隨基因組和基因組學(xué)的出現(xiàn)而出現(xiàn)的.蛋白組(proteme)的概念是由于基因表達(dá)水平并不能代表細(xì)胞中活性蛋白質(zhì)的數(shù)量, 基因組序列并不能描述活性蛋白質(zhì)所必需的翻譯后修飾和反映蛋白質(zhì)種類和含量的動(dòng)態(tài)變化過(guò)程而提出的.在一定條件下某一基因組蛋白質(zhì)表達(dá)的數(shù)量類型稱為蛋白組, 代表這一有機(jī)體全部蛋白質(zhì)組成及其作用方式.有關(guān)蛋白組的研究稱為蛋白組學(xué).其中, 蛋白組的研究技術(shù)與方法、雙向凝膠電泳圖譜以及對(duì)不同條件下蛋白組變化的比較分析是蛋白組學(xué)的主要研究?jī)?nèi)容。生物信息學(xué)在基因組和蛋白組研究中所起的作用主要有:(1)基因組信息結(jié)構(gòu)的計(jì)算分析.即對(duì)基因組數(shù)據(jù)進(jìn)行大規(guī)模并行計(jì)算并預(yù)測(cè)各種新基因和功能位點(diǎn), 研究大量非編碼區(qū)序列的信息結(jié)構(gòu)和可能的生物學(xué)意義。(2)模式生物全基因組信息結(jié)構(gòu)的比較研究.即
對(duì)已完成全基因組測(cè)序的各種模式生物的基因組信息結(jié)構(gòu)進(jìn)行比較分析, 包括同源序列的搜索比較和指導(dǎo)基因克隆.(3)功能基因組的相關(guān)信息分析, 包括對(duì)基因表達(dá)圖譜及其相關(guān)算法和軟件的研究, 與功能基因組信息相關(guān)的核酸、蛋白質(zhì)的空間結(jié)構(gòu)的預(yù)測(cè)模擬以及蛋白質(zhì)的功能預(yù)測(cè)。
2、生物信息數(shù)據(jù)庫(kù)
復(fù)雜的生物和生物界和日新月異的生命科學(xué)研究產(chǎn)出的大量的生物學(xué)信息,對(duì)這些信息的儲(chǔ)存、檢索、比較分析必須借助于計(jì)算機(jī)數(shù)據(jù)庫(kù)技術(shù), 包括各類生物學(xué)信息數(shù)據(jù)庫(kù)的建立與維護(hù)、數(shù)據(jù)的添加與注釋、更新與查詢、數(shù)據(jù)庫(kù)資料的網(wǎng)絡(luò)化等研究?jī)?nèi)容?,F(xiàn)有的數(shù)據(jù)庫(kù)有:核酸序列數(shù)據(jù)庫(kù)(GenBank、EMBL、DDBJ)、基因組數(shù)據(jù)庫(kù)、基因圖譜數(shù)據(jù)庫(kù)、蛋白質(zhì)序列數(shù)據(jù)庫(kù)(SWTSS-
PROT、PIR)和蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)(Interpro)等。隨著生命科學(xué)的不斷發(fā)展,數(shù)據(jù)庫(kù)種類不斷增加、結(jié)構(gòu)日益復(fù)雜、使用也越來(lái)越方便。
生物信息學(xué)作為一門(mén)新興學(xué)科已經(jīng)成為生命科學(xué)研究中必不可少的研究手段 本文對(duì)數(shù)據(jù)庫(kù)與數(shù)據(jù)庫(kù)搜索序列比對(duì)蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)藥物設(shè)計(jì)基因芯片技術(shù)幾個(gè)方面做了介紹較為系統(tǒng)地闡述了生物信息學(xué)在這些領(lǐng)域的應(yīng)用 當(dāng)然它所涉及的內(nèi)容與方法遠(yuǎn)遠(yuǎn)不只上面提到的那些 新基因和 的發(fā)現(xiàn)與鑒定非編碼區(qū)信息結(jié)構(gòu)分析遺傳密碼的起源和生物進(jìn)化完整基因組的比較
研究 大規(guī)?;蚬δ鼙磉_(dá)譜的分析等都是生物信息學(xué)研究的對(duì)象 相信不久的將來(lái)生物信息學(xué)會(huì)在生命
科學(xué)領(lǐng)域扮演越來(lái)越重要的角色。
參考文獻(xiàn):
1、現(xiàn)代生物信息學(xué)及其主要研究領(lǐng)域 蕭浪濤(湖南農(nóng)業(yè)大學(xué)理學(xué)院, 湖南長(zhǎng)沙 410128)
2、生物信息學(xué)技術(shù)進(jìn)展 郭志云 張懷渝 梁龍 軍事醫(yī)學(xué)科學(xué)院 生物工程研究所,北京100071;四川農(nóng)業(yè)大學(xué)生命科學(xué)及理學(xué)院,雅安 6250143、利用生物信息學(xué)技術(shù)研究蛋白功能的幾種方法 王劍利 楊章民綜述 王一理審閱 西安交通大學(xué)醫(yī)學(xué)院免疫病理學(xué)研究室(西安, 710061)
第三篇:生物信息學(xué)
生物信息學(xué)是上世紀(jì)90年代初人類基因組計(jì)劃(HGP)依賴,隨著基因組學(xué)、蛋白組學(xué)等新興學(xué)科的建立,逐漸發(fā)展起來(lái)的生物學(xué)、數(shù)學(xué)和計(jì)算機(jī)信息科學(xué)的一門(mén)交叉應(yīng)用學(xué)科。目前生物信息學(xué)的研究領(lǐng)域主要包括基于生物序列數(shù)據(jù)的整理和注釋、生物信息挖掘工具開(kāi)發(fā)及利用這些工具揭示生物學(xué)基礎(chǔ)理論知識(shí)等領(lǐng)域。生物信息學(xué)作為新型交叉應(yīng)用學(xué)科,可以依托本校已有的計(jì)算機(jī)科學(xué)、信息學(xué)、生物學(xué)和數(shù)學(xué)等學(xué)科優(yōu)勢(shì),充分展現(xiàn)投入少、見(jiàn)效快、起點(diǎn)高的特色,推動(dòng)學(xué)校學(xué)科建設(shè)和本科教學(xué)水平。
本實(shí)驗(yàn)指導(dǎo)書(shū)中的8個(gè)實(shí)驗(yàn)均設(shè)計(jì)為綜合性開(kāi)發(fā)實(shí)驗(yàn),面向生物信息學(xué)院全體本科學(xué)生和研究生,以及全校對(duì)生物信息學(xué)感興趣的其他專業(yè)學(xué)生開(kāi)放。生物信息學(xué)實(shí)驗(yàn)室將提供系統(tǒng)的保障,包括采用mail服務(wù)器和linux帳號(hào)管理等進(jìn)行實(shí)驗(yàn)過(guò)程管理和支持。限選《生物信息學(xué)及實(shí)驗(yàn)》的生物技術(shù)專業(yè)本科生至少選擇其中5個(gè)實(shí)驗(yàn),并不少于8個(gè)學(xué)時(shí),即為課程要求的0.5個(gè)學(xué)分。其他選修者按照課時(shí)和學(xué)校相關(guān)規(guī)定計(jì)算創(chuàng)新學(xué)分。實(shí)驗(yàn)一 熟悉生物信息學(xué)網(wǎng)站及其數(shù)據(jù)的生物學(xué)意義
實(shí)驗(yàn)?zāi)康模?/p>
培養(yǎng)學(xué)生利用互聯(lián)網(wǎng)資源獲取生物信息學(xué)研究前沿和相關(guān)數(shù)據(jù)的能力,熟悉生物信息學(xué)相關(guān)的一些重要國(guó)內(nèi)外網(wǎng)站,及其核酸序列、蛋白質(zhì)序列及代謝途徑等功能相關(guān)數(shù)據(jù)庫(kù),學(xué)會(huì)下載生物相關(guān)的信息數(shù)據(jù),了解不同的數(shù)據(jù)文件格式和其中重要的生物學(xué)意義。
實(shí)驗(yàn)原理:
利用互聯(lián)網(wǎng)資源檢索相關(guān)的國(guó)內(nèi)外生物信息學(xué)相關(guān)網(wǎng)站,如:NCBI、SANGER、TIGR、KEGG、SWISSPORT、Ensemble、中科院北京基因組研究所、北大生物信息
學(xué)中心等,下載其中相關(guān)的數(shù)據(jù),如fasta、genbank格式的核算和蛋白質(zhì)序列、pathway等數(shù)據(jù),理解其重要的生物學(xué)意義。
實(shí)驗(yàn)內(nèi)容:
1.瀏覽和搜索至少10個(gè)國(guó)外和至少5個(gè)國(guó)內(nèi)生物信息學(xué)相關(guān)網(wǎng)站,并描
述網(wǎng)站特征;
2.下載各網(wǎng)站的代表性數(shù)據(jù)各10條(組)以上,并說(shuō)明其生物學(xué)意義;
3.討論各網(wǎng)站適合做何種生物信息學(xué)研究的平臺(tái),并設(shè)計(jì)一個(gè)研究設(shè)想。實(shí)驗(yàn)報(bào)告:
1.各網(wǎng)站網(wǎng)址及特征描述;
2.代表性數(shù)據(jù)的下載和生物學(xué)意義的描述;
3.討論:這些生物信息學(xué)相關(guān)網(wǎng)站的信息資源,可以被那些生物信息學(xué)
研究所利用。
參考書(shū)目:
《生物信息學(xué)概論》 羅靜初 等譯,北京大學(xué)出版社,2002;《生物信息學(xué)手冊(cè)》 郝柏林 等著,上??萍汲霭嫔?,2004;
《生物信息學(xué)實(shí)驗(yàn)指導(dǎo)》 胡松年 等著,浙江大學(xué)出版社,2003。實(shí)驗(yàn)二 利用BLAST進(jìn)行序列比對(duì)
實(shí)驗(yàn)?zāi)康模?/p>
了解BLAST及其子程序的原理和基本參數(shù),熟練地應(yīng)用網(wǎng)絡(luò)平臺(tái)和Linux計(jì)算平臺(tái)進(jìn)行本地BLAST序列比對(duì),熟悉BLAST結(jié)果的格式和內(nèi)容并能描述其主要意義,同時(shí)比較網(wǎng)上平臺(tái)和本地平臺(tái)的優(yōu)缺點(diǎn)。
實(shí)驗(yàn)原理:
利用實(shí)驗(yàn)一下載的核算和蛋白質(zhì)序列,提交到NCBI或者其他擁有BLAST運(yùn)算平臺(tái)的網(wǎng)頁(yè)上,觀察其基本參數(shù)設(shè)定庫(kù)文件類型,并得到計(jì)算結(jié)果;同時(shí)在本地服務(wù)器上學(xué)會(huì)用formatdb格式化庫(kù)文件,并輸入BLAST命令進(jìn)行計(jì)算,獲得結(jié)果文件。
實(shí)驗(yàn)內(nèi)容:
1.向網(wǎng)上BLAST服務(wù)器提交序列,得到匹配結(jié)果;
2.本地使用BLAST,格式化庫(kù)文件,輸入命令行得到匹配結(jié)果;
3.對(duì)結(jié)果文件進(jìn)行簡(jiǎn)要描述,闡述生物學(xué)意義。
實(shí)驗(yàn)報(bào)告:
1.闡述BLAST原理和比對(duì)步驟;
2.不同類型BLAST的結(jié)果及其說(shuō)明;
3.討論:不同平臺(tái)運(yùn)行BLAST的需求比較。
參考書(shū)目:
《生物信息學(xué)概論》 羅靜初 等譯,北京大學(xué)出版社,2002;
《生物信息學(xué)實(shí)驗(yàn)指導(dǎo)》 胡松年 等著,浙江大學(xué)出版社,2003。
實(shí)驗(yàn)三 利用ClustalX(W)進(jìn)行
多序列聯(lián)配
實(shí)驗(yàn)?zāi)康模?/p>
掌握用Clustal X(W)工具及其基本參數(shù),對(duì)具有一定同源性和相似性的核酸與蛋白質(zhì)序列進(jìn)行聯(lián)配和聚類分析,由此對(duì)這些物種的親緣關(guān)系進(jìn)行判斷,并且對(duì)這些序列在分子進(jìn)化過(guò)程中的保守性做出估計(jì)。
實(shí)驗(yàn)原理:
首先對(duì)于輸入的每一條序列,兩兩之間進(jìn)行聯(lián)配,總共進(jìn)行n*(n-1)/2次聯(lián)配,這一步通過(guò)一種快速的近似算法實(shí)現(xiàn),其得分用來(lái)計(jì)算指導(dǎo)樹(shù),系統(tǒng)樹(shù)圖能用于指導(dǎo)后面進(jìn)行的多序列聯(lián)配的過(guò)程。系統(tǒng)樹(shù)圖是通過(guò)UPGMA方法計(jì)算的。在系統(tǒng)樹(shù)圖繪制完以后,輸入的所有序列按照得分高低被分成n-1個(gè)組,然后再對(duì)組與組之間進(jìn)行聯(lián)配,這一步用Myers和Miller算法實(shí)現(xiàn)。
實(shí)驗(yàn)內(nèi)容:
1.明確軟件所支持的輸入文件格式,搜集整理出合適的數(shù)據(jù);
2.在Windows環(huán)境運(yùn)行Clustal X,在Linux環(huán)境運(yùn)行Clustal W;
3.實(shí)驗(yàn)結(jié)果及分析,用TREEV32或Njplotwin95生成NJ聚類圖。
實(shí)驗(yàn)報(bào)告:
1.整理好的符合Clustal的序列數(shù)據(jù);
2.提交數(shù)據(jù)網(wǎng)頁(yè)記錄和各步驟記錄;
3.提供聚類圖和多序列聯(lián)配圖,并說(shuō)明意義。
參考書(shū)目:
《生物信息學(xué)概論》 羅靜初 等譯,北京大學(xué)出版社,2002;
《生物信息學(xué)實(shí)驗(yàn)指導(dǎo)》 胡松年 等著,浙江大學(xué)出版社,2003。實(shí)驗(yàn)四 ESTS分析
實(shí)驗(yàn)?zāi)康模?/p>
熟悉使用一系列生物信息學(xué)分析工具對(duì)測(cè)序得到ESTs序列數(shù)據(jù)進(jìn)行聚類處理,由此對(duì)獲得表達(dá)基因的豐度等相關(guān)信息,并且對(duì)這些表達(dá)基因進(jìn)行功能的初步詮釋,為后續(xù)實(shí)驗(yàn)通過(guò)設(shè)計(jì)RACE引物獲得全長(zhǎng)基因,以及進(jìn)一步的功能注
釋和代謝途徑分析做好準(zhǔn)備。
實(shí)驗(yàn)原理:
首先用crossmatch程序去除ESTs原始序列中的載體成分和引物成分,然后用phrap生成congtig和singlet,用blast程序進(jìn)一步將有同源性的contig和singlet進(jìn)行功能聚類,最后通過(guò)blast對(duì)聚類獲得的cluster進(jìn)行功能注釋。在實(shí)驗(yàn)過(guò)程中將用到一些本實(shí)驗(yàn)室寫(xiě)好的perl程序用于連接各數(shù)據(jù)庫(kù)和工具軟件。
實(shí)驗(yàn)內(nèi)容:
1.運(yùn)行CodonCode Aligner程序,并用它建立工程文件,導(dǎo)入例子文件
夾里面的數(shù)據(jù);練習(xí)對(duì)序列的各種查看方式。
2.使用CodonCode Aligner程序里的Clip Ends, Trim Vector, Assemble
等功能,完成序列的剪切、去雜質(zhì)、組裝工作。
實(shí)驗(yàn)報(bào)告:
1.實(shí)驗(yàn)各步驟記錄和中間結(jié)果文件;
2.舉例簡(jiǎn)要說(shuō)明結(jié)果文件中數(shù)據(jù)的生物學(xué)意義。
參考書(shū)目:
《生物信息學(xué)概論》 羅靜初 等譯,北京大學(xué)出版社,2002;
《基因表達(dá)序列標(biāo)簽(EST)數(shù)據(jù)分析手冊(cè)》 胡松年 等著,浙江大學(xué)出版社,2005。
實(shí)驗(yàn)五 利用Primer Premier5.0設(shè)計(jì)
RACE引物
實(shí)驗(yàn)?zāi)康模?/p>
熟悉PCR引物設(shè)計(jì)工具Primer Premier5.0的一些基本功能,能夠根據(jù)實(shí)驗(yàn)需要選擇相應(yīng)的引物設(shè)計(jì)方法設(shè)計(jì)PCR引物。
實(shí)驗(yàn)原理:
PCR實(shí)驗(yàn)是當(dāng)代分子生物學(xué)的基本實(shí)驗(yàn)之一,由于目標(biāo)序列和實(shí)驗(yàn)?zāi)康牡牟煌鄳?yīng)設(shè)計(jì)引物的要求也不一樣。本實(shí)驗(yàn)延續(xù)ESTs分析結(jié)果,對(duì)于其中需要獲得全長(zhǎng)的基因進(jìn)行RACE引物的設(shè)計(jì),及5’和3’RACE引物,配合接頭序列設(shè)計(jì)單向引物,并模擬練習(xí)通過(guò)連接獲得全長(zhǎng)的基因CDS序列。最后設(shè)計(jì)已知全長(zhǎng)基因序列的PCR擴(kuò)增引物。
實(shí)驗(yàn)內(nèi)容:
1.從網(wǎng)站下載并安裝Primer Premier5.0;
2.從 GenBank 中任意獲取一個(gè) DNA 序列,設(shè)計(jì)出該序列的合適引物; 實(shí)驗(yàn)報(bào)告:
1.實(shí)驗(yàn)各步驟使用的數(shù)據(jù)、運(yùn)算平臺(tái)、結(jié)果文件記錄;
2.比較不同引物設(shè)計(jì)平臺(tái)和不同PCR實(shí)驗(yàn)的差別;
參考書(shū)目:
《生物信息學(xué)概論》 羅靜初 等譯,北京大學(xué)出版社,2002;《生物信息學(xué)實(shí)驗(yàn)指導(dǎo)》 胡松年 等著,浙江大學(xué)出版社,2003。
實(shí)驗(yàn)八 perl程序的安裝、編寫(xiě)、調(diào)試 實(shí)驗(yàn)?zāi)康模?/p>
培養(yǎng)學(xué)生能在windows和Linux兩種平臺(tái)安裝perl解釋器、編寫(xiě)perl程序以及debug和運(yùn)行的能力,熟悉perl語(yǔ)言基本語(yǔ)法,學(xué)會(huì)熟練編寫(xiě)和運(yùn)用perl程序進(jìn)行基礎(chǔ)生物信息學(xué)研究。
實(shí)驗(yàn)原理:
Perl語(yǔ)言是一門(mén)通用的腳本語(yǔ)言,具有強(qiáng)大的字符串處理功能,是生物信息學(xué)研究的強(qiáng)大幫手,學(xué)會(huì)了perl語(yǔ)言,就能方便地處理生物信息學(xué)研究中遇到的各種字符串文本,促進(jìn)研究的快速進(jìn)行。
實(shí)驗(yàn)內(nèi)容:
1.下載perl程序在Windows和Linux下的安裝包并進(jìn)行安裝;
2.編寫(xiě)簡(jiǎn)單的perl程序,并學(xué)會(huì)debug;
3.編寫(xiě)具有簡(jiǎn)單功能的堿基處理perl程序。
實(shí)驗(yàn)報(bào)告:
1.perl解釋器安裝方法;
2.perl解釋器debug方法;
3.討論:perl語(yǔ)言在生物信息學(xué)研究中所起到的積極作用。
參考書(shū)目:
《PERL 編程24學(xué)時(shí)教程》(美)皮爾斯著 王建華等譯,機(jī)械工業(yè)出版社,2000;
《生物信息學(xué)手冊(cè)》 郝柏林 等著,上海科技出版社,2004;《生物信息學(xué)實(shí)驗(yàn)指導(dǎo)》 胡松年 等著,浙江大學(xué)出版社,2003
第四篇:生物信息學(xué)小結(jié)
1. 什么是(基因)生物信息學(xué)?
目前一般意義的生物信息學(xué)是基因?qū)哟蔚?/p>
它是一個(gè)包含著基因組信息的獲取、處理、存儲(chǔ)、分配、分析和解釋的所有方面學(xué)科領(lǐng)域。
生物信息學(xué)是把基因組DNA序列信息分析作為源頭,破譯隱藏在DNA序列中的遺傳語(yǔ)言,特別是非編碼區(qū)的實(shí)質(zhì);同時(shí)在發(fā)現(xiàn)了新基因信息之后進(jìn)行蛋白質(zhì)空間結(jié)構(gòu)模擬和預(yù)測(cè)。
他是近年來(lái)發(fā)展并完善起來(lái)的交叉學(xué)科。這門(mén)學(xué)科是綜合運(yùn)用生物學(xué)、數(shù)學(xué)、物理學(xué)、信息科學(xué)以及計(jì)算機(jī)科學(xué)等諸多學(xué)科的理論方法的嶄新交叉學(xué)科。
生物信息學(xué)已成為整個(gè)生命科學(xué)發(fā)展的重要組成部分,成為生命科學(xué)研究的前沿?;蚪M信息
蛋白質(zhì)的結(jié)構(gòu)模擬 藥物設(shè)計(jì)
它們是生物信息學(xué)的三個(gè)重要組成部分,生物信息學(xué)目前已在理論生物學(xué)領(lǐng)域占有了核心地位,它廣泛地應(yīng)用在生物、醫(yī)藥、農(nóng)業(yè)、環(huán)境等學(xué)科。
2.廣義生物信息學(xué)主要包括哪幾個(gè)方面? 廣義生物信息學(xué)主要包括如下幾個(gè)方面:
一、生物的遺傳信息
DNA―RNA―蛋白質(zhì),遺傳信息—轉(zhuǎn)錄—翻譯,遺傳信息生物信息學(xué)。
二、生命活動(dòng)的調(diào)控
基因的功能、表達(dá)和調(diào)控(表觀遺傳學(xué))。蛋白的結(jié)構(gòu)、功能和調(diào)控;細(xì)胞活動(dòng)(分化、發(fā)育、衰老、死亡)的調(diào)控,器官、系統(tǒng)、整體活動(dòng)的調(diào)控;節(jié)律、生物鐘、分蘗、生長(zhǎng)、開(kāi)花、結(jié)果、營(yíng)養(yǎng)的吸收、傳輸、轉(zhuǎn)化、對(duì)外界信號(hào)的反應(yīng):含羞草、抗逆性。
三、生物電磁學(xué)與電磁生物學(xué)
生物電磁學(xué):生命活體在不同層次(電子、離子、原子、基因、細(xì)胞、組織、整體等)的活動(dòng)和不同屬性(包括思維、精神)活動(dòng)時(shí)以及和外界環(huán)境(生命體周圍直至宇宙)相互作用時(shí)反映出來(lái)的各種電磁信息。人體的電磁輻射(包括發(fā)光):頻率、強(qiáng)度、頻譜。人體信號(hào)的調(diào)制方式:調(diào)幅、調(diào)頻、編碼。
電磁生物學(xué):電磁輻射對(duì)生物體的影響,電磁場(chǎng)導(dǎo)致DNA突變,體內(nèi)細(xì)胞電離、極化狀態(tài)變化導(dǎo)致疾病。
四、視覺(jué)系統(tǒng)與光信息處理
視網(wǎng)膜神經(jīng)元回路與信息處理、彩色視覺(jué)及彩色圖像的編碼、變換機(jī)制、眼動(dòng)成象機(jī)制及寬視場(chǎng)、消色差動(dòng)態(tài)成象系統(tǒng)、視覺(jué)認(rèn)知機(jī)制及其圖像信息的智能模式識(shí)別、不同狀態(tài)立體視覺(jué)機(jī)制和靜態(tài)、動(dòng)態(tài)立體視銳度。
五、腦和神經(jīng)系統(tǒng)與信息
腦的感知覺(jué)信息處理原理及其應(yīng)用,學(xué)習(xí)、記憶、思維,邏輯思維和形象思維,思維模型與信息處理系統(tǒng)新原理的研究,新的計(jì)算模型、新型計(jì)算機(jī)、如:神經(jīng)計(jì)算機(jī)。
六、生物體結(jié)構(gòu)與微光機(jī)電系統(tǒng)
DNA驅(qū)動(dòng)的微細(xì)機(jī)器人,生物大分子到細(xì)胞基本結(jié)構(gòu)體系的自組裝、自組織,創(chuàng)造新物質(zhì)的分子工程學(xué)研究,分子聚集體的化學(xué)。
納米生物技術(shù)將納米技術(shù)和生物技術(shù)相集成,在生物醫(yī)學(xué)、電子學(xué)、材料學(xué)、環(huán)境科學(xué)等諸多領(lǐng)域具有良好的應(yīng)用前景。在生物芯片、分子馬達(dá)、生物探針、納米生物材料等迅速發(fā)展。
七、基因芯片、蛋白質(zhì)芯片等
目前一般意義的生物信息學(xué)是基因?qū)哟蔚模墙陙?lái)發(fā)展并完善起來(lái)的交叉學(xué)科。這門(mén)學(xué)科是綜合運(yùn)用生物學(xué)、數(shù)學(xué)、物理學(xué)、信息科學(xué)以及計(jì)算機(jī)科學(xué)等諸多學(xué)科的理論方法的嶄新交叉學(xué)科。
3.Internet有哪些基本功能?
Internet不僅向其用戶提供了全球范圍的信息交流與快速通訊手段,其本身也具有極其豐富的信息資源,包括新聞、書(shū)刊雜志、數(shù)據(jù)庫(kù)、計(jì)算機(jī)軟件、多媒體資料等,也包括大量的生物信息學(xué)資源。
4.什么是Entrez?Entrez主要包括哪幾個(gè)數(shù)據(jù)庫(kù)?
Entrez(http://www.ncbi.nim.nih.gov/entraz)是美國(guó)國(guó)立醫(yī)學(xué)圖書(shū)館國(guó)家生物技術(shù)信息中心(National Center for Biotechnology Information, NCBI)建立的生物醫(yī)學(xué)數(shù)據(jù)庫(kù)集成檢索系統(tǒng)。系統(tǒng)中的數(shù)據(jù)庫(kù)包括核酸序列數(shù)據(jù)庫(kù)、蛋白質(zhì)序列數(shù)據(jù)庫(kù)、大分子三維結(jié)構(gòu)數(shù)據(jù)庫(kù)、全部基因組、孟德?tīng)柸祟愡z傳及通過(guò)PubMed檢索的MEDLINE。Entrez集成系統(tǒng)的最大特點(diǎn)是通過(guò)任何一個(gè)數(shù)據(jù)庫(kù)檢索出的信息可直接鏈接到Entrez其它數(shù)據(jù)庫(kù)并找到相關(guān)的檢索結(jié)果。
5.PubMed的一般檢索方法有幾種檢索途徑?
通過(guò)NCBI首頁(yè)(http://www.ncbi.nlm.nih.gov/)或NCBI的Entrez檢索系統(tǒng)(http://www.ncbi.nlm.nih.gov/Entrez/)選擇PubMed鏈接選項(xiàng)或直接在瀏覽器地址欄(URL)中輸入“http://www.ncbi.nlm.nih.gov/entrez/query.fcgidb=PubMed”即可進(jìn)入
PubMed檢索界面。PubMed有多種檢索途徑,包括自由詞、文獻(xiàn)作者、規(guī)范主題詞(MeSH)、期刊名稱、文獻(xiàn)出版年代、文獻(xiàn)類型、文獻(xiàn)語(yǔ)種、物質(zhì)名稱、記錄入檔日期、文獻(xiàn)出版日期等。既可以單一字段檢索,又可以利用高級(jí)布爾邏輯表達(dá)式多字段組配檢索。
6.國(guó)際上三大DNA數(shù)據(jù)庫(kù)是什么數(shù)據(jù)庫(kù)? ,國(guó)際三大DNA數(shù)據(jù)庫(kù):NCBI的GenBank,歐洲分子生物學(xué)實(shí)驗(yàn)室(European Molecular Biology Laboratory, EMBL)、日本DNA數(shù)據(jù)庫(kù)(DNA Data Bank of Japan,DDBJ)
7.簡(jiǎn)述進(jìn)行基因搜索時(shí)的基本步驟 ?
在進(jìn)行基因搜索時(shí)的基本步驟:
1、尋找DNA序列中基因不可能出現(xiàn)的區(qū)域,并將此遮蔽起來(lái)。
2、在啟動(dòng)子區(qū)尋找一致的模式,找出轉(zhuǎn)錄因子識(shí)別DNA結(jié)合區(qū)域。
3、尋找轉(zhuǎn)錄的起始密碼、終止密碼和剪切位點(diǎn)。
4、找出編碼區(qū)。然后將全部收集到的信息匯總整理成總體上盡可能連貫的譜圖。注意進(jìn)行不同的分析時(shí)使用不同的軟件工具以及程序適用的物種選擇和應(yīng)用范圍等。
8.BLAST的主要功能都包括什么 ?
1、核酸數(shù)據(jù)庫(kù)搜索
組合基因組檢索;分為標(biāo)準(zhǔn)的核酸與核酸數(shù)據(jù)庫(kù)搜索;MEGABLAST提供大量長(zhǎng)序列的比較;完全匹配的短序列搜索;特殊搜索。
2、蛋白數(shù)據(jù)庫(kù)搜索
分為標(biāo)準(zhǔn)的蛋白與蛋白數(shù)據(jù)庫(kù)搜索;PSI-and PHI-BLAST,其中PSI用于搜索證實(shí)遠(yuǎn)源進(jìn)化關(guān)系的存在與否和進(jìn)一步獲取這個(gè)蛋白家族中的功能信息,而PHI用于搜索蛋白基序;同樣包括蛋白的完全匹配的短序列搜索。
3、已翻譯蛋白的BLAST搜索
包括[blastx],[tblastn],[tblastx]
4、保守區(qū)域的搜索:主要使用RPS-BLAST程序完成。
5、配對(duì)序列的兩兩比較:用于核酸和蛋白的兩兩比較分析。
6、針對(duì)特定數(shù)據(jù)庫(kù)的搜索:比如人類基因組、微生物基因組等。
9.利用核酸序列進(jìn)行基因結(jié)構(gòu)預(yù)測(cè)的基本步驟是什么?(不確定)一個(gè)全面的基因搜索方案,無(wú)論是通過(guò)單個(gè)集成的程序?qū)崿F(xiàn),還是通過(guò)多個(gè)程序分步實(shí)現(xiàn),基本的思路是相同的:
1、通常如果一個(gè)序列中某一區(qū)域出現(xiàn)重復(fù)序列,該區(qū)域不大可能處于調(diào)控區(qū)域和編碼區(qū)域。
2、如果某一片段與其它基因或基因產(chǎn)物有序列相似性,該片段是外顯子的可能性極大。
3、一段序列上存在著統(tǒng)計(jì)的規(guī)則性,表現(xiàn)為顯著的“密碼子偏好”,是蛋白編碼區(qū)最明顯的標(biāo)志之一。
4、與模板模式相符可能指出DNA上功能性位點(diǎn)的位置。這類分析可以基于很簡(jiǎn)單的模式(例如,眾所周知的“TATA box”和剪接點(diǎn)的保守序列)或基于相當(dāng)復(fù)雜的推理(例如,在后面將提到的啟動(dòng)子搜尋算法中)。
10.根據(jù)蛋白質(zhì)的氨基酸序列預(yù)測(cè)其空間結(jié)構(gòu)主要預(yù)測(cè)方法有哪兩類?
預(yù)測(cè)方法主要有兩類:
一、采用分子力學(xué)、分子動(dòng)力學(xué)的方法,根據(jù)物理化學(xué)的基本原理,從理論上預(yù)測(cè)蛋白質(zhì)分子的空間結(jié)構(gòu)。
二、通過(guò)對(duì)已知空間結(jié)構(gòu)的蛋白質(zhì)進(jìn)行分析,找出一級(jí)結(jié)構(gòu)與空間結(jié)構(gòu)的關(guān)系,總結(jié)出規(guī)律,用于新的蛋白質(zhì)空間結(jié)構(gòu)的預(yù)測(cè)。本章介紹利用分析蛋白質(zhì)氨基酸的組成來(lái)確認(rèn)未知蛋白的計(jì)算工具、蛋白翻譯后修飾、蛋白功能預(yù)測(cè)。
組成蛋白質(zhì)的氨基酸序列為蛋白質(zhì)的一級(jí)結(jié)構(gòu),蛋白質(zhì)的一級(jí)結(jié)構(gòu)決定了蛋白質(zhì)的性質(zhì)。組成蛋白質(zhì)的氨基酸的物理和化學(xué)性質(zhì)早已被人熟知。構(gòu)成蛋白質(zhì)的20種氨基酸由于化學(xué)構(gòu)造不同,在結(jié)構(gòu)和功能上具有多樣性,任一殘基對(duì)蛋白質(zhì)的物理和生化性質(zhì)都會(huì)產(chǎn)生影響,即序列決定構(gòu)象。由于蛋白質(zhì)空間結(jié)構(gòu)的基礎(chǔ)是一級(jí)結(jié)構(gòu),近年來(lái)根據(jù)蛋白質(zhì)的氨基酸序列預(yù)測(cè)其空間結(jié)構(gòu),受到科學(xué)家的關(guān)注。
11.談?wù)剬W(xué)習(xí)生物信息學(xué)的體會(huì)(自己發(fā)揮吧)
有點(diǎn)粗糙,見(jiàn)諒
六哥
第五篇:生物信息學(xué)論文
生物信息學(xué)的進(jìn)展綜述
韓雪晴
(生物工程1201班,學(xué)號(hào):201224340124)
摘要:生物信息學(xué)是一門(mén)研究生物和生物相關(guān)系統(tǒng)中信息內(nèi)容和信息流向的綜合性系統(tǒng)科學(xué)。80年代以來(lái)新興的一門(mén)邊緣學(xué)科,信息在其中具有廣闊的前景。伴隨著人類基因組計(jì)劃的勝利完成與生物信息學(xué)的發(fā)展有著密不可分的聯(lián)系,生物信息學(xué)的發(fā)展為生命科學(xué)的發(fā)展為生命科學(xué)的研究帶來(lái)了諸多的便利,對(duì)此作了簡(jiǎn)單的分析。
關(guān)鍵詞:生物信息學(xué);進(jìn)展;序列比對(duì);生物芯片
A review of the advances in Bioinformatics
Han Xueqing(Bioengineering, Class1201,Student ID:201224340124)
Abstract: Bioinformatics is the science of comprehensive system of information content and information flows to a study on the biological and bio related in the system.The edge of an emerging discipline since 80, has broad prospects in which information.With the human genome project was completed and the development of bioinformatics are inextricably linked, for the life science research development of bioinformatics for the development of life science has also brought a lot of convenience, has made the simple analysis.Keywords:
bioinformatics;progress;Sequence alignment;biochip
1、生物信息學(xué)的產(chǎn)生背景
生物信息學(xué)是20世紀(jì)80年代末開(kāi)始,隨著基因組測(cè)序數(shù)據(jù)迅猛增加而逐漸興起的一門(mén)學(xué)科[1]。應(yīng)用系統(tǒng)生物學(xué)的方法認(rèn)識(shí)生物體代謝、發(fā)育、分化、進(jìn)化以及疾患發(fā)生規(guī)律的不可或缺的工具[2]。及時(shí)、充分、有效地利用網(wǎng)絡(luò)上不斷增長(zhǎng)的生物信息數(shù)據(jù)庫(kù)資源,已經(jīng)成為生命科學(xué)和生物技術(shù)研究開(kāi)發(fā)的必要手段,從而誕生了生物信息學(xué)。
2、生物信息學(xué)研究?jī)?nèi)容
主要是利用計(jì)算機(jī)存儲(chǔ)核酸和蛋白質(zhì)序列,通過(guò)研究科學(xué)的算法,編制相應(yīng)的軟件對(duì)序列進(jìn)行分析、比較與預(yù)測(cè),從中發(fā)現(xiàn)規(guī)律。白細(xì)胞介素-6(IL-6)是機(jī)體重要的免疫因子,但在兩棲類中未見(jiàn)報(bào)道。采用生物信息學(xué)方法對(duì)兩棲類模式動(dòng)物非洲爪蟾IL-6進(jìn)行分析[3]。以人IL-6基因?qū)Ψ侵拮笖?shù)據(jù)庫(kù)進(jìn)行搜索、分析,并采用RT-PCR方法對(duì)所得序列進(jìn)行驗(yàn)證。結(jié)果表明,非洲爪蟾IL-6基因位于scaffold_52基因架上,具有保守的IL-6家族基序[4]。采用生物信息新方法進(jìn)行不同物種的免疫基因挖掘、克隆,是一種有效的方法[5]。
2.1序列比對(duì)
比較兩個(gè)或兩個(gè)以上符號(hào)序列的相似性或不相似性。序列比對(duì)是生物信息學(xué)的基礎(chǔ)。兩個(gè)序列的比對(duì)現(xiàn)在已有較成熟的動(dòng)態(tài)規(guī)劃算法,以及在此基礎(chǔ)上編寫(xiě)的比對(duì)軟件包BLAST和FASTA[6]。序列數(shù)據(jù)庫(kù)搜索最著名且最常用的工具之一便是BLAST算法。FASTA算法是另一族常用的序列比對(duì)及搜索工具[7]。
2.2結(jié)構(gòu)比對(duì)
比較兩個(gè)或兩個(gè)以上蛋白質(zhì)分子空間結(jié)構(gòu)的相似性或不相似性。
2.3蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)
從方法上來(lái)看有演繹法和歸納法兩種途徑。前者主要是從一些基本原理或假設(shè)出發(fā)來(lái)預(yù)測(cè)和研究蛋白質(zhì)的結(jié)構(gòu)和折疊過(guò)程。分子力學(xué)和分子動(dòng)力學(xué)屬這一范疇。后者主要是從觀察和總結(jié)已知結(jié)構(gòu)的蛋白質(zhì)結(jié)構(gòu)規(guī)律出發(fā)來(lái)預(yù)測(cè)未知蛋白質(zhì)的結(jié)構(gòu)[8]。
3、生物信息學(xué)的新技術(shù) 3.1 Lipshutz(Affymetrix,Santa clara,CA,USA)
描述了一種利用DNA探針陣列進(jìn)行基因組研究的方法,其原理是通過(guò)更有效有作圖、表達(dá)檢測(cè)和多態(tài)性篩選方法,可以實(shí)現(xiàn)對(duì)人類基因組的測(cè)序[9]。光介導(dǎo)的化學(xué)合成法被應(yīng)用于制造小型化的高密度寡核苷酸探針的陣列,這種通過(guò)軟件包件設(shè)計(jì)的寡核苷酸探針陣列可用于多態(tài)性篩查、基因分型和表達(dá)檢測(cè)[10]。
3.2基因的功能分析
Overton(University of Pennsylvania School of Medicine,Philadelphia,PA,USA)論述了人類基因組計(jì)劃的下一階段的任務(wù)基因組水平的基因功能分析。
4生物信息學(xué)前沿
4.1生物芯片技術(shù)
4.1.1生物芯片的簡(jiǎn)介
生物芯片技術(shù)是通過(guò)縮微技術(shù),根據(jù)分子間特異性地相互作用的原理,按照芯片上固化的生物材料的不同,可以將生物芯片劃分為基因芯片、蛋白質(zhì)芯片、細(xì)胞芯片和組織芯片。4.1.2生物芯片的基本內(nèi)容
生物芯片技術(shù)通過(guò)微加工工藝在厘米見(jiàn)方的芯片上集成有成千上萬(wàn)個(gè)與生命相關(guān)的信息分子,它可以對(duì)生命科學(xué)與醫(yī)學(xué)中的各種生物化學(xué)反應(yīng)過(guò)程進(jìn)行集成,從而實(shí)現(xiàn)對(duì)基因、配體、抗原等生物活性物質(zhì)進(jìn)行高效快捷的測(cè)試和分析。4.1.3生物芯片的發(fā)展
生物芯片將會(huì)給21世紀(jì)整個(gè)人類生活帶來(lái)一場(chǎng)“革命”。生物芯片產(chǎn)業(yè)也有望與“微電子芯片”并列成為21世紀(jì)最大的產(chǎn)業(yè)之一。4.1.4與生物芯片相關(guān)的技術(shù)
平面微加工技術(shù)、微機(jī)械技術(shù)、CCD成像技術(shù)、基因芯片技術(shù)等。
4.2藥物設(shè)計(jì)與生物信息學(xué)
藥物基因組學(xué)可以說(shuō)是基因功能學(xué)與分子藥理學(xué)的有機(jī)結(jié)合,在很多方面這種結(jié)合是非常必要的。藥物基因組學(xué)以藥物效應(yīng)及安全性為目標(biāo),研究各種基因突變與藥效及安全性的關(guān)系。
4.3基因治療
基因治療(gene therapy)是指將外源正?;?qū)氚屑?xì)胞,以糾正或補(bǔ)償因基因缺陷和異常引起的疾病,達(dá)到治療目的[11]。也就是將外源基因通過(guò)基因轉(zhuǎn)移技術(shù)將其插入病人的適當(dāng)?shù)氖荏w細(xì)胞中,使外源基因制造的產(chǎn)物能治療某種疾病[12]。通過(guò)對(duì)miR-29a進(jìn)行靶基因預(yù)測(cè)及相關(guān)生物信息學(xué)分析,為miR-29a靶基因的實(shí)驗(yàn)驗(yàn)證提供數(shù)據(jù)支持,以期為深入研究miR-29a的生物學(xué)功能和調(diào)控機(jī)制提供理論指導(dǎo)[13]。從廣義說(shuō),基因治療還可包括從DNA水平采取的治療某些疾病的措施和新技術(shù)。在基因治療中迄今所應(yīng)用的目的基因轉(zhuǎn)移方法可分為兩大類:病毒方法和非病毒方法[14]。
4.4虛擬細(xì)胞--人工生命的模型
虛擬細(xì)胞是應(yīng)用信息科學(xué)的原理和技術(shù),通過(guò)數(shù)學(xué)的計(jì)算和分析,對(duì)細(xì)胞的結(jié)構(gòu)和功能進(jìn)行分析、整合和應(yīng)用,以模擬和再現(xiàn)細(xì)胞和生命的現(xiàn)象的一門(mén)新興學(xué)科。虛擬細(xì)胞亦稱人工細(xì)胞或人工生命[15]。目前,國(guó)際上已有兩個(gè)虛擬細(xì)胞問(wèn)世,一個(gè)是日本的原核虛擬細(xì)胞模型,一個(gè)是美國(guó)的真核虛擬細(xì)胞模型。
參考文獻(xiàn)
[1].張陽(yáng)德,生物信息學(xué)(第二版)科學(xué)出版社,2010,21世紀(jì)高等院校教材ISBN978-7-03-023931-0 [2].邁克爾 R.巴恩斯(Barnes.M.R.),遺傳學(xué)工作者的生物信息學(xué),科學(xué)出版社2010年10月1日出版ISBN 9787030254900 [3].齊志濤;張啟煥;王資生;許偉;黃貝;王愛(ài)民,非洲爪蟾IL-6基因的克隆及生物信息學(xué)分析 出版日期: 2010 [4].齊志濤;張啟煥;黃貝;王資生;仇明;黃金田;許偉;王愛(ài)民.非洲爪蟾BAFF及其信號(hào)通路相關(guān)基因的比較生物信息學(xué)分析,生物技術(shù),2011,(4):
[5].廖明幟,生物背景學(xué)生的《生物信息學(xué)》課程教學(xué)思考與探索,教育教學(xué)論壇,2014年第36期
[6].Dan E.Krane&Michael L.Raymer,生物信息學(xué)概論,清華大學(xué)出版社 2010年出版
[7].Eddy S R.Profile Hidden Markov Models.Bioinformatics,1998,14(9):755~763 [8].Coombes KR,Fristche HA,Clarke,et al.Qutility control and peak finding for proteomics data collected from nipple aspirate fluid by surface-en-hanced laser desorption and ionization.Clin Chem,2013,49(10):1615~1623 [9].Lim HA,Batt tR.TIBTECH,1998;16(3)):104.[10].Williams n.Science,1997;277(5328):902.[11].顧健人,曹雪濤,基因治療,北京:科學(xué)出版社,2011 [12].余國(guó)膺,生物信息學(xué),中國(guó)心臟起博與心電生理雜志,2014年01期 [13].施偉杰
曾玉
姚純
曹笑梅
童華,miR-29a靶基因預(yù)測(cè)及其相關(guān)生物信息學(xué)分析,現(xiàn)代生物醫(yī)學(xué)進(jìn)展,2014年32期
[14].安冬
姜濤
張翠麗
殷玉玲
曹雪姣
辛毅,臧師竹利用生物信息學(xué)研究肥胖與2型糖尿病患者肝組織基因表達(dá)變化,《現(xiàn)代生物醫(yī)學(xué)進(jìn)展》 2014年30期
[15].孫冬泳,湯健,虛擬細(xì)胞-人工生命的模型,中華醫(yī)學(xué)雜志,2011,21(81):1342~1344